1С:Распознавание речи

1000,00
Для чего нужен сервис 1С:Распознавание речи?
Автоматическое преобразование речи в текст помогает усовершенствовать бизнес-процессы в различных ситуациях использования:
  • Распознавание речи позволит быстрее и проще надиктовать длинные тексты вместо их набора с клавиатуры. Электронные письма, текстовые блоки в документах, содержание задач и комментариев удобнее вводить голосом, особенно, если у пользователя заняты руки, а также при работе на мобильных устройствах.
  • Можно распознавать записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Для получения лучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
  • Можно разработать на 1С голосовое управление интерфейсом приложений: по команде голосом открывать нужные формы, строить отчеты, выполнять поиск, заполнять реквизиты.
  • Можно применять в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
  • Можно использовать работу с дополнительной грамматикой при потоковом распознавании речи: при начале распознавания можно передать какие-то специфичные термины (фамилии сотрудников, названия номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.
Как бесплатно подключить и использовать сервис 1С:Распознавание речи?
Тестовый период для интернет-сервиса "1С Распознавание речи" могут подключить пользователи 1С, зарегистрированные на портале 1С portal.1c.ru и имеющие доступ к обновлениям 1С. Локальное распознавание речи бесплатно, но требует дополнительных вычислительных ресурсов.
Как работает сервис 1С:Распознавание речи?
В рамках сервиса доступны следующие услуги:
  • Потоковое распознавание - пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Это удобно для того, чтобы надиктовать письма, или реализовать управление интерфейсом программы. Длительность одного сеанса при потоковом распознавании речи с помощью сервиса имеет ограничение в 2 часа. Потоковое распознавание при локальном распознавании речи по длительности сеанса не ограничено.
  • Файловое распознавание - пользователь отправляет в сервис файл с аудио, в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае, пользователь может отправить готовый аудио-файл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и загрузки сервиса. Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться независимо. Для распознавания принимаются форматы аудио: WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио: от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1 Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания из сервиса в течение 7 суток после выполнения задания.

Что такое облачное и локальное использование сервиса 1С:Распознавание речи?
Сервис "1С:Распознавание речи" доступен из платформы "1С:Предприятие 8" версии 8.3.23 и старше средствами встроенного языка. Распознавание речи в 1С доступно как с помощью облачного интернет-сервиса 1С, так и локально.
При использования облачного сервиса распознавания речи через интернет требуется купить "1С Распознавание речи" по тарифам выше. Локальное распознавание речи бесплатно, но требует дополнительных вычислительных ресурсов: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 12 Гбайт и выше.
Для использования распознавания речи локально с помощью "1С:Предприятия 8" требуется скачать модели распознавания из облака 1С. Для скачивания моделей необходимо, чтобы программа 1С находилась на официальной поддержке и был куплен доступ к обновлениям 1С. Для дальнейшего использовании распознавания речи в 1С локально, договор ИТС для распознавания не требуется.
Также фирма 1С выпустила демо-приложение (библиотека), которое позволит выполнить регистрацию в сервисе для использования облачного распознавания речи, или скачать модели для работы локального распознавания. Демо-приложение можно скачать по адресу: https://speech.1c.ai/speech-demo.zip.
Что такое тарифные единицы для сервиса "1С:Распознавание речи"?
Стоимость использования облачного сервиса распознавания зависит от типа услуги и длительности речи.
Потоковое распознавание. Единица тарификации распознавания равна 1 секунде потокового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудиоданных. То есть, например, за распознавание потокового аудио длительностью 12 секунд будет списано 20 единиц тарификации, а для потокового аудио длительностью 64 секунды – 80 единиц.
Файловое распознавание. Единица тарификации распознавания равна 4 секундам файлового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудио-файла. То есть, например, за распознавание файла длительностью 12 секунд будет списано 5 тарифных единиц, а для аудио-файла длительностью 64 секунды – 20 единиц.
Количество списываемых единиц тарификации в файловом варианте зависит от количества каналов в аудиозаписи. При файловом распознавании с помощью облачного сервиса каждый аудиоканал тарифицируется по отдельности. Если в записи 2 или 3 канала, которые распознаются независимо, будет списано, соответственно, в 2 или в 3 раза больше единиц тарификации по сравнению с одноканальной записью.
Возможность разделения по спикерам в сервисе "1С:Распознавание речи"
В сервисе "1С:Распознавание речи" реализована функция разделения по спикерам. Она позволяет получить расшифровку аудиофайла с делением её на собеседников. В результате преобразования аудиозаписи, в которой есть одновременная речь нескольких человек, пользователь получит текст, в котором будут результаты распознавания отдельно по каждому из спикеров. Данная функция доступна при использовании модели распознавания "Экспериментальная с разделением по спикерам". Пример использования разделения по спикерам и удобный метод отображения результата рекомендуем посмотреть в демо-приложении функционала "1С:Распознавание речи", которое можно бесплатно скачать по ссылке https://speech.1c.ai/apps/demo_app/.
Функцию разделения по спикерам можно использовать, например, для получения транскрибации (преобразование аудио в текст) разговоров, например, в следующих случаях: проведение собеседований, опросов пользователей, совещаний и так далее.