Baidu тестирует сервис для конвертации аудио в текст с помощью ИИ
Интервьюеры спасены: китайский технологический гигант выпустил приложение для транскрибации SwiftScribe, основанное на нейросетях.
В мире умных гаджетов и общительных интерфейсов конвертация аудио в текст занимает колоссальное количество времени. Это не нравится многим: от журналистов и писателей до HR и полицейских. Китайский IT-гигант Baidu представил программу SwiftScribe, которая, вооружившись искусственным интеллектом, обещает решить эту проблему.
SwiftScribe вышла в закрытой бете, и пока компания приглашает к участию всего 50 фонотипистов. Дата полноценного релиза и стоимость продукта ещё неизвестны. По словам проектного менеджера Baidu Тян Ву, уже сейчас SwiftScribe экономит в среднем 40% времени и неустанно обучается на пользовательских аудиофайлах.
SwiftScribe работает как веб-приложение для браузера Chrome и поддерживает файлы в форматах .mp3 и .wav продолжительностью до 60 минут (оценить программу на тестовом фрагменте можно тут). Демонстрационное видео:
Напомним, ранее мы писали, что Baidu открыла амбициозную Лабораторию дополненной реальности, а искусственный интеллект IBM вот-вот догонит человека в умении распознавать беглую речь.
Если вы хотите подсказать нам новость, отправьте намёк на почту редактору jk@cossa.ru (а вот пресс-релизы в этот раздел отправлять не нужно). Если вы стесняетесь, можете прислать новость анонимно.
Успейте купить корпоративный пакет COSSA-2025 со скидкой!
Cossa анонсирует главный рекламный формат на весь 2025 год: сразу 8 различных опций.
Пакет идеально подходит для онлайн-сервисов, стартапов, интернет-компаний и digital-агентств.
Успейте приобрести пакет до повышения цены!