Что: 94cf819e49d4e1f78279ef001bd2a9556b8004f3 Когда: 2023-09-17 22:10:00+03:00 ------------------------------------------------------------------------ Темы: tip ------------------------------------------------------------------------ Впервые потрогал что-то связанное с нейросетями https://github.com/ggerganov/whisper.cpp Программа которая может транскрибировать аудиофайлы. Зависимостей для сборки не требует. Но нужно скачать модель. Я использовал "large" модель, которая 3GB+ требует памяти -- для меня копейки. Решил проверить на аудиокниге из "Созвездия льва" (859b583e6ea48f5bb3de8338274d7fe936c2f225) "Роберт Шекли -- О высоких материях". Книга длится 357 сек. На восьми ядрах NUC работа заняла 504 сек. То бишь, в полтора раза медленнее чем неспешное чтение книги. [...] [00:04:03.440 --> 00:04:11.960] несамостоятельность. Лапух. Любому неприятно было бы угодить в подобный переплет. Но что же в [00:04:11.960 --> 00:04:19.280] жизни главное? Мортенсен загасил сигарету и вспомнил, что она у него последняя. Тьфу, [00:04:19.280 --> 00:04:25.760] только не отвлекаться. Главное в жизни — сомнение, желание, стремление к цели, [00:04:25.760 --> 00:04:34.040] наслаждение. Потерев лоб, Мортенсен громко, хоть и слегка дрожащим голосом, выговорил — главное [00:04:34.040 --> 00:04:43.280] в жизни — воспламенение. Воцарилась зловещая тишина. Выждав пристойный по своим понятиям срок, [00:04:43.280 --> 00:04:52.280] Мортенсен спросил — угадал я или нет? — Воспламенение, — пророкотал возвышенный [00:04:52.280 --> 00:05:04.520] могущественный глаз. — Чересчур длинно. Горение? Тоже длинновато. Огонь! Главное в жизни — огонь. [00:05:04.520 --> 00:05:14.240] Подходит. — Я и имел в виду огонь, — вывернулся Мортенсен. — Ты меня действительно выручил, [00:05:14.240 --> 00:05:20.080] — заверил голос. — Ведь я прямо завяз на этом слове. А теперь помоги разобраться [00:05:20.080 --> 00:05:26.560] с семьдесят восьмым по горизонтали. Отчество изобретателя бесфрикционного привода для [00:05:26.560 --> 00:05:31.960] звездолётов. Четвёртая буква «Д» вертится на языке, да вот никак не поймаю. [00:05:31.960 --> 00:05:38.680] По словам Мортенсена, тут он повернулся кругом и пошёл себе в освояси подальше от [00:05:38.680 --> 00:05:48.040] неземного глаза и от высоких материй. Роберт Шекли [00:05:48.040 --> 00:05:53.720] О высоких материях Рассказ читал Олег Булдаков [00:05:53.720 --> 00:05:58.480] [музыка] Это конечно не готовый для публикации текст, есть косячки, но в целом всё отлично. Но это очень качественно записанная книга с качественным диктором. А как оно справится например с моей презентацией NNCP на CryptoInstallFest? [00:00:10.000 --> 00:00:16.000] Всем привет! Сергей Матвеев, я разработчик заданного программа "Досучение" и "Шифровал". [00:00:16.000 --> 00:00:23.000] Сегодня я хотел бы рассказать про NCP, это набор утилит, которые позволяют строить в сторону форвард-сети, [00:00:23.000 --> 00:00:29.000] которые можно использовать, например, для построения независимых от интернета сети передачи данных. [00:00:29.000 --> 00:00:34.000] Про эту тему я уже рассказывал в прошлом году на CryptoCentralFest, [00:00:34.000 --> 00:00:38.000] эта тема просто немного более расширена. [00:00:38.000 --> 00:00:48.000] В предыдущей лекции все отлично сказали про все наши проблемы с интернетом, [00:00:48.000 --> 00:00:58.000] про то, что мы его по сути потеряли, теряем, и я уверен, безвозвратно, и у нас огромные проблемы. [00:00:58.000 --> 00:01:05.000] То есть интернет, как некое чудо света, когда два произвольных компьютера между собой могут обменяться произвольными данными, [00:01:05.000 --> 00:01:12.000] мы вовсю теряем. И восстановить это я не знаю как, это невозможно. [...] [00:04:39.000 --> 00:04:45.000] Это клиент включается к серверу и ему дают, в общем-то, просто закрытую программу, [00:04:45.000 --> 00:04:49.000] 99%, что это будет отдельно стервенный natural script код, сравнение с эндвером. [00:04:49.000 --> 00:04:53.000] И эта программа полностью контролирует, что он может сделать, [...] [00:06:04.000 --> 00:06:09.000] Какие решения? Очевидно, прокладывать собственный канал связи, как говорят, дорого, [00:06:09.000 --> 00:06:12.000] просто и смертно это не могут сделать, и если у нас будет вайп-рейс блокировки, местами я даже не понимаю о чём речь и не могу вспомнить что именно то я говорил? Но большая часть текста вполне себе понятна и читабельна. Всё же и я говорю не очень, и запись не очень, и язык с жаргонами и подобным. Я не знаю хороший ли это результат или нет, но вообще меня впечатляет. А то как-то я вот не слышу чтобы в кой да веки но был сделан что синтезатор речи отличный (хотя вроде бы very good enough уже есть), что распознаватор. Добавление -mavx512f флага показывает что AVX512 включён (на новом сервере моём), но это не то чтобы ощутимо помогает: 532 vs 547 сек. ------------------------------------------------------------------------ оставить комментарий: mailto:comment@blog.stargrave.org?subject=Re:%20%D0%92%D0%BF%D0%B5%D1%80%D0%B2%D1%8B%D0%B5%20%D0%BF%D0%BE%D1%82%D1%80%D0%BE%D0%B3%D0%B0%D0%BB%20%D1%87%D1%82%D0%BE-%D1%82%D0%BE%20%D1%81%D0%B2%D1%8F%D0%B7%D0%B0%D0%BD%D0%BD%D0%BE%D0%B5%20%D1%81%20%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D1%81%D0%B5%D1%82%D1%8F%D0%BC%D0%B8%20%2894cf819e49d4e1f78279ef001bd2a9556b8004f3%29 ------------------------------------------------------------------------ комментарий 0: From: Unit404 Date: 2023-09-19 04:10:47Z Фоновая музыка сказывается на результате? ------------------------------------------------------------------------ комментарий 1: From: Sergey Matveev Date: 2023-09-19 07:31:32Z *** Unit404 [2023-09-18 21:20]: >Фоновая музыка сказывается на результате? Проверил на одном из выпусков Модели для сборки (Sergej_Chekmaev,Andrey_Nikolaev-StandArt.opus), где музыка довольно громкая. Забыл указать -l ru: [00:00:00.000 --> 00:00:00.960] [VIDEO PLAYBACK] [00:00:00.960 --> 00:00:03.920] [MUSIC PLAYING] [00:00:03.920 --> 00:00:07.360] [MUSIC PLAYING] [00:00:07.360 --> 00:00:10.840] [MUSIC PLAYING] [00:00:11.200 --> 00:00:13.000] [SPEAKING RUSSIAN] [00:00:13.000 --> 00:00:16.480] [MUSIC PLAYING] указал явно русский язык: [00:00:00.000 --> 00:00:10.000] Без коры [00:00:10.000 --> 00:00:14.000] Не открывая глаз, Борис пошарил рукой по постели. [00:00:14.000 --> 00:00:16.000] Пусто. [00:00:16.000 --> 00:00:18.000] Очень хорошо. [00:00:18.000 --> 00:00:21.000] Значит, оставив спящего хозяина, гости ушли и никого не забыли. [00:00:21.000 --> 00:00:23.000] А ведь могли, кстати. [00:00:23.000 --> 00:00:25.000] Или что еще хуже? [00:00:25.000 --> 00:00:27.000] Очередная энтузиастка, возомнившая себя музой, [00:00:27.000 --> 00:00:29.000] могла остаться по собственной инициативе, [00:00:29.000 --> 00:00:31.000] чтобы бескорыстным служением художнику [00:00:31.000 --> 00:00:34.000] внести свой скромный вклад в умирающее искусство. [00:00:34.000 --> 00:00:38.000] Как-то одна такая затаилась среди неоконченных скульптур. [00:00:38.000 --> 00:00:41.000] Заснула, а Борис чуть инфаркт не хватил, [00:00:41.000 --> 00:00:45.000] когда в предрассветном сумраке одна из фигур зашевелилась. [00:00:45.000 --> 00:00:50.000] «Отчего так получается?» - подумал он с тоской. [00:00:50.000 --> 00:00:52.000] «Вроде уже настроился работать, [00:00:52.000 --> 00:00:54.000] но стоит заявиться очередной компанией [00:00:54.000 --> 00:00:57.000] абсолютно тебе неинтересных, ненужных и совершенно пустяшных людей, [00:00:57.000 --> 00:01:02.000] как ты с радостью все бросаешь и присоединяешься к общему веселью». [00:01:02.000 --> 00:01:07.000] В студии стоял космический холод. [00:01:07.000 --> 00:01:09.000] На ночь Борис открыл окна, чтобы избавиться от дыма, [00:01:09.000 --> 00:01:12.000] запаха объедков и перегаров. Тоже всё отлично. Кроме самой первой строчки "Без коры": мои уши вообще никакого звука, кроме музыки, не слышали до "Не открывая глаз". Откуда эта "без коры" вообще не ясно :-) ------------------------------------------------------------------------ Сгенерирован: SGBlog 0.34.0