Для чего нужен сервис 1С:Распознавание речи? Автоматическое преобразование речи в текст помогает усовершенствовать бизнес-процессы в различных ситуациях использования:
Распознавание речи позволит быстрее и проще надиктовать длинные тексты вместо их набора с клавиатуры. Электронные письма, текстовые блоки в документах, содержание задач и комментариев удобнее вводить голосом, особенно, если у пользователя заняты руки, а также при работе на мобильных устройствах.
Можно распознавать записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Для получения лучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
Можно разработать на 1С голосовое управление интерфейсом приложений: по команде голосом открывать нужные формы, строить отчеты, выполнять поиск, заполнять реквизиты.
Можно применять в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
Можно использовать работу с дополнительной грамматикой при потоковом распознавании речи: при начале распознавания можно передать какие-то специфичные термины (фамилии сотрудников, названия номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.
Как бесплатно подключить и использовать сервис 1С:Распознавание речи? Тестовый период для интернет-сервиса "1С Распознавание речи" могут подключить пользователи 1С, зарегистрированные на портале 1С portal.1c.ru и имеющие доступ к обновлениям 1С. Локальное распознавание речи бесплатно, но требует дополнительных вычислительных ресурсов. Как работает сервис 1С:Распознавание речи? В рамках сервиса доступны следующие услуги:
Потоковое распознавание - пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Это удобно для того, чтобы надиктовать письма, или реализовать управление интерфейсом программы. Длительность одного сеанса при потоковом распознавании речи с помощью сервиса имеет ограничение в 2 часа. Потоковое распознавание при локальном распознавании речи по длительности сеанса не ограничено.
Файловое распознавание - пользователь отправляет в сервис файл с аудио, в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае, пользователь может отправить готовый аудио-файл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и загрузки сервиса. Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться независимо. Для распознавания принимаются форматы аудио: WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио: от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1 Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания из сервиса в течение 7 суток после выполнения задания.
Что такое облачное и локальное использование сервиса 1С:Распознавание речи? Сервис "1С:Распознавание речи" доступен из платформы "1С:Предприятие 8" версии 8.3.23 и старше средствами встроенного языка. Распознавание речи в 1С доступно как с помощью облачного интернет-сервиса 1С, так и локально. При использования облачного сервиса распознавания речи через интернет требуется купить "1С Распознавание речи" по тарифам выше. Локальное распознавание речи бесплатно, но требует дополнительных вычислительных ресурсов: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 12 Гбайт и выше. Для использования распознавания речи локально с помощью "1С:Предприятия 8" требуется скачать модели распознавания из облака 1С. Для скачивания моделей необходимо, чтобы программа 1С находилась на официальной поддержке и был куплен доступ к обновлениям 1С. Для дальнейшего использовании распознавания речи в 1С локально, договор ИТС для распознавания не требуется. Также фирма 1С выпустила демо-приложение (библиотека), которое позволит выполнить регистрацию в сервисе для использования облачного распознавания речи, или скачать модели для работы локального распознавания. Демо-приложение можно скачать по адресу: https://speech.1c.ai/speech-demo.zip. Что такое тарифные единицы для сервиса "1С:Распознавание речи"? Стоимость использования облачного сервиса распознавания зависит от типа услуги и длительности речи. Потоковое распознавание. Единица тарификации распознавания равна 1 секунде потокового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудиоданных. То есть, например, за распознавание потокового аудио длительностью 12 секунд будет списано 20 единиц тарификации, а для потокового аудио длительностью 64 секунды – 80 единиц. Файловое распознавание. Единица тарификации распознавания равна 4 секундам файлового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудио-файла. То есть, например, за распознавание файла длительностью 12 секунд будет списано 5 тарифных единиц, а для аудио-файла длительностью 64 секунды – 20 единиц. Количество списываемых единиц тарификации в файловом варианте зависит от количества каналов в аудиозаписи. При файловом распознавании с помощью облачного сервиса каждый аудиоканал тарифицируется по отдельности. Если в записи 2 или 3 канала, которые распознаются независимо, будет списано, соответственно, в 2 или в 3 раза больше единиц тарификации по сравнению с одноканальной записью. Возможность разделения по спикерам в сервисе "1С:Распознавание речи" В сервисе "1С:Распознавание речи" реализована функция разделения по спикерам. Она позволяет получить расшифровку аудиофайла с делением её на собеседников. В результате преобразования аудиозаписи, в которой есть одновременная речь нескольких человек, пользователь получит текст, в котором будут результаты распознавания отдельно по каждому из спикеров. Данная функция доступна при использовании модели распознавания "Экспериментальная с разделением по спикерам". Пример использования разделения по спикерам и удобный метод отображения результата рекомендуем посмотреть в демо-приложении функционала "1С:Распознавание речи", которое можно бесплатно скачать по ссылке https://speech.1c.ai/apps/demo_app/. Функцию разделения по спикерам можно использовать, например, для получения транскрибации (преобразование аудио в текст) разговоров, например, в следующих случаях: проведение собеседований, опросов пользователей, совещаний и так далее.