Какие форматы файлов поддерживает DropVox?

DropVox поддерживает широкий спектр аудио и видео форматов: MP3, WAV, M4A, FLAC, OGG, WEBM, MP4, MOV, AVI, MKV. Также можно вставить ссылку на YouTube, RuTube или VK Video для прямой транскрибации.

Насколько точная транскрибация?

DropVox использует современную модель Whisper large-v3. Точность для русского языка — менее 10% ошибок (WER), для английского — менее 5%. Точность разделения спикеров — более 90% для 2-4 участников.

Что такое разделение спикеров (диаризация)?

Разделение спикеров автоматически определяет и разделяет речь разных участников записи. DropVox присваивает уникальные метки каждому спикеру и отображает их сегменты с цветовой маркировкой.

Можно ли задавать вопросы по транскрипции?

Да! DropVox использует RAG-технологию для ответов на вопросы по содержимому транскрипции. AI даёт точные ответы со ссылками на источники и таймкодами.

Есть ли бесплатный тариф?

Да, DropVox предлагает бесплатные первые 5 минут каждого файла. Платите только за использованное время — 5₽/мин. Платные тарифы дают скидки на объём и дополнительные функции.

Как скачать транскрипцию?

DropVox позволяет экспортировать транскрипции в форматах TXT, SRT, VTT, JSON, DOCX и PDF. Выберите нужный формат в меню экспорта после завершения транскрибации.

Насколько точная транскрипция?

Мы используем OpenAI Whisper large-v3 — самую точную модель для распознавания речи. Для русского и английского языков точность составляет 95%+. Качество зависит от чистоты записи — фоновый шум и наложение голосов могут снижать точность.

Какие языки поддерживаются?

Whisper поддерживает 99 языков, включая русский, английский, немецкий, французский, испанский, китайский, японский и другие. Автоопределение языка работает автоматически, но вы можете указать язык вручную.

Сколько времени занимает обработка?

Обычно 1-2 минуты на каждые 10 минут записи. Время зависит от качества аудио, количества спикеров и текущей нагрузки на сервера. Pro и Business тарифы получают приоритетную обработку.

Где хранятся мои данные?

Все данные хранятся на серверах в России (дата-центр в Москве). Мы соблюдаем требования 152-ФЗ о персональных данных. Вы можете удалить свои данные в любой момент.

Можно ли использовать API?

Да, начиная с тарифа Pro доступен REST API для программной интеграции. Документация и примеры кода предоставляются. Вебхуки уведомят ваш сервер о завершении обработки.

Что такое разделение спикеров?

Технология diarization автоматически определяет, кто говорит в каждый момент записи. Мы определяем до 10 разных голосов. Вы можете переименовать "Спикер 1" в реальное имя участника.

Как работает семантический поиск?

В отличие от обычного поиска по ключевым словам, семантический поиск понимает смысл запроса. Ищете "финансовые результаты" — найдёте фрагменты про выручку, прибыль, бюджет, даже если эти слова не использовались.

Нужна ли подписка?

Нет. Первые 5 минут каждого файла бесплатны, а если нужен файл целиком — его можно оплатить разово, без подписки. Если расшифровываете регулярно, подписка делает каждую минуту дешевле. Подробности на странице тарифов.

DropVox — транскрибация аудио и видео с AI в текст

Гайды

Таймкоды в транскрипции: как быстро находить нужные моменты записи

Разбираем, как таймкоды в транскрипции помогают находить нужные моменты записи, точно цитировать аудио и видео и экспортировать временные метки в TXT, SRT, VTT и JSON.

20 июня 2026 г.4 мин

Гайды

SRT или VTT: какой формат субтитров выбрать после транскрибации

SRT или VTT — разбираем разницу форматов субтитров и даём практическую матрицу выбора. SRT — универсальный стандарт для редакторов и плееров, VTT (WebVTT) — веб-формат для HTML5-видео. Оба доступны в экспорте DropVox.

19 июня 2026 г.4 мин

Технологии

Семантический поиск по транскрипциям: чем он отличается от поиска по словам

Семантический поиск по транскрипциям находит фрагменты по смыслу, а не по точному совпадению слов. Объясняем, чем векторный поиск и embeddings отличаются от обычного поиска по словам, что вы получаете на выходе и когда поиск по смыслу полезнее всего.

18 июня 2026 г.5 мин

Превратите аудио в текст

Смотрите в действии

AI-возможности нового уровня

Умный конспект с ИИ

Ключевые темы

Решения

Мощные возможности для работы с аудио

Точная транскрипция

Разделение спикеров

Семантический поиск

Форматы экспорта

AI-ответы на вопросы

Транскрипция видео

Как это работает

Загрузите аудио или видео

AI обрабатывает запись

Работайте с текстом

Для кого подходит DropVox

Журналисты и редакторы

Исследователи и аналитики

Подкастеры и видеоблогеры

Бизнес и HR

Преподаватели и студенты

Юристы и нотариусы

Поддерживаемые форматы

Аудио форматы

Видео форматы

Видеоплатформы

Последние статьи

Таймкоды в транскрипции: как быстро находить нужные моменты записи

SRT или VTT: какой формат субтитров выбрать после транскрибации

Семантический поиск по транскрипциям: чем он отличается от поиска по словам

Тарифы

Часто задаваемые вопросы

Готовы начать?