Устав ждать, когда на рынке появится удобный продукт, превращающий устную речь в письменный текст, уроженец Киева Алексей Дунаев придумал сервис TranscribeMe, который совмещает программу с реальными расшифровщиками, и принялся искать клиентов.

 

СФЕРА ДЕЯТЕЛЬНОСТИ

Расшифровка голосовой речи

ДАТА СТАРТА

2011 год

 

Он начал выполнять заказы вручную и параллельно вместе с командой строил платформу, ориентируясь на запросы уже существующих пользователей. Через полгода работы Дунаев получил $1 млн ангельских инвестиций и сейчас надеется, что через два года оборот TranscribeMe превысит $10 млн.

бюджет на старт

$100 000

САЙТ

transcribeme.com

Алексей ДУНАЕВ

основатель сервиса TranscribeMe

 

Как всё начиналось

Я родился на Украине, в детстве с родителями переехал в Россию, потом — в Англию, учился в Новой Зеландии по специальностям «программирование» и «менеджмент». Стартапами я начал заниматься ещё во время учёбы, 10 лет назад. В первых двух компаниях мы с друзьями писали программы для автоматизации финансовых транзакций, но проекты не получились: рынок был ещё не готов. Когда первый стартап провалился, мы взяли его главную идею и сделали на её основе второй. Затем, когда провалился второй, мы снова трансформировали идею и сделали третий.

Третьим бизнесом была компания AXI Web Solutions, которая предоставляла услуги веб-дизайна крупным компаниям. Этот бизнес я за два года вырастил и продал. Тогда мне было 27 лет, я приехал в США получать MBA в Стэнфорде по программе государственных грантов Fulbright.

 

Поиски ниши

Последние 20 лет компьютерная индустрия всё время обещала нам, что автоматическое распознавание голоса станет возможно совсем скоро: то через пять лет, то через десять. Мы с моим партнёром Игорем Фирером (также является сооснователем Green Light Energy Solutions, американской компании по разработке и производству оборудования для переработки отходов) решили попробовать разработать свою технологию. Спрос на услуги транскрипции в США очень большой, объём рынка примерно $5-6 млрд. Но и конкуренция высокая: это и небольшие краудсорсинговые компании Scribie, Verbalizelt, Rev, и такие крупные игроки, как GMR Transcription и TransPerfect.

На этом рынке есть разные ниши. Сервисы Nuance и Siri используют чисто автоматизированные переводы — они дешёвые и быстрые, но некачественные: если люди говорят с акцентом или присутствуют посторонние звуки, транскрипция будет неточной. Есть также люди, которые расшифровывают записи вручную, но это дорого и медленно.

Мы придумали гибридный подход — использовать последние технологии распознавания голоса одновременно с работой людей: компьютер расшифровывает речь с точностью «от 0 до Х%», а потом люди доводят эту точность до 100%.

 

 

Самое сложное — найти рынок и определить потребности клиента. Любая техническая проблема решается, особенно в случае гибридного подхода, где часть работы выполняется людьми

 

 

Старт проекта

В июне 2011 года мы начали работать над идеей: написали бизнес-план, стали проверять разные варианты развития компании. Через три месяца мы официально её зарегистрировали и собрали команду из умных и азартных людей.

Тогда мы не знали, как всё это будет работать технически и кто наши клиенты. Мы понимали, что это прибыльный рынок и что существующие решения не удовлетворяют спрос. Мы составили список из 20 отраслей экономики, в которых наша услуга может использоваться: туда вошли образование, СМИ, издательский бизнес, маркетинг. Потом мы начали обзванивать всех, кому, как мы считали, она нужна. По сути, мы решили продавать продукт, которого на тот момент ещё не было. Мы звонили из Сан-Франциско в Лондон потенциальным клиентам в три-четыре утра и говорили: «У нас есть продукт, не хотите ли его купить?» Вначале мы думали, что наш продукт пригодится журналистам, но быстро поняли, что у них нет денег, особенно у сотрудников больших газет.

К тому же процесс набора текста для журналиста очень важен: они обдумывают идеи, пока расшифровывают интервью. А вот маркетологам очень понравилось. Писатели, особенно успешные, тоже заинтересовались: обычным способом они пишут четыре книги в год, а если надиктовывать текст, то пять. 

 

TranscribeMe: Как создать сервис распознавания речи. Изображение № 1.

 

Технология

На роль технического директора мы пригласили Виктора Оболонкина. Он создал технологию отслеживания редких птиц в лесу с помощью анализа звуков. Виктор тоже стал сооснователем. В первые три-четыре месяца все заказы мы выполняли вручную: я, Игорь и Витя расшифровывали записи сами. Когда мы определились с технологией, мы сначала частично, а потом полностью автоматизировали наши процессы, подключили к платформе расшифровщиков.

В основе нашей платформы — запатентованная технология TranscribeMe, которая автоматически разрезает поступающие от заказчика аудио- или видеофайлы на фрагменты длительностью в 7-10 секунд, транскрибирует их с помощью нашего движка и рассылает расшифровщикам в разных частях мира. Несколько расшифровщиков одновременно прослушивают эти фрагменты и проверяют текст, который расшифровал компьютер. Из соображений конфиденциальности весь заказ целиком расшифровщики не видят.

Затем сотрудники отдела оценки качества вычитывают полный текст, и он отправляется клиенту. За счёт того, что над одним заказом одновременно работают сотни людей, получается быстро.

Расшифровщики регистрируются у нас на сайте, мы проверяем, что они умеют делать, и когда приходит заказ, мы показываем им его фрагменты. Минимальное время работы — это несколько секунд.

Расшифровщиков мы специально не ищем. Они либо приходят по рекомендациям других сотрудников, либо узнают о нас на форумах. В нашей индустрии много мошенников, которые пишут: «Работайте из дома и получайте деньги», — но не платят. Для нас главная задача — платить вовремя. Всё началось с того, как наш первый расшифровщик написал на форуме: «TranscribeMe заплатили мне вовремя, вот скриншот из PayPal». Сейчас расшифровкой занимаются более 10 000 человек в более чем 70 странах. Больше всего расшифровщиков у нас в Америке, они работают с английским, испанским и китайским языками.

 

Прототип и продукт

Есть три стадии развития компании: из идеи — в прототип, из прототипа — в продукт, из продукта — на рынок. На первой стадии, имея на руках только идею, мы собрали $100 000 — все, кто могли, дали нам деньги. Но в основном деньги были мои и Игоря. На них к февралю 2012 года мы своими силами создали прототип.

Он работал медленно и только в Chrome, его главные блоки не были связаны между собой, всё выглядело некрасиво, но он работал. Также эти первые деньги мы потратили на маркетинг, рекламу и зарплату первого программиста. Он взял наш прототип и стал делать на его основе коммерческий продукт.

 

 

В Восточной Европе программисты говорили, что им нужны не опционы, а большая зарплата. Это похоже на фабричное мышление: я прихожу на работу, отрабатываю смену, ухожу домой

 

 

Весной и осенью 2012 года в ангельском раунде мы собрали около $1млн. На эти деньги мы за год превратили прототип в коммерческий продукт. Сейчас мы находимся на стадии вывода продукта на рынок. Наш годовой оборот немного больше $1 млн.

На поиск инвесторов никакие личные контакты не повлияли — их просто не было. Почти никого из своих инвесторов я раньше не знал, хоть и заканчивал Стэнфорд. Так что мы шли по самому длинному пути: бизнес-план по электронной почте, отборочная комиссия, 10-минутный разговор по телефону, приглашение на ужин, презентация. Потом инвесторы задают тебе вопросы и принимают решение.

В Кремниевой долине две группы инвесторов: одни хотят, чтобы компания встала на ноги и развивалась, а другие — чтобы она подняла инвестиции, а потом её купила большая компания. Мы сейчас рассматриваем оба направления.

 

Команда

В команде сейчас 25 человек, все работают full-time. Наш главный офис находится в Сан-Франциско — здесь у нас отделы продаж и маркетинга. В Окленде (Новая Зеландия) расположены основное руководство бизнесом и крауд-менеджмент. Только что мы открыли офис в Минске, сейчас там работают пять разработчиков. Можно было нанять программистов в Калифорнии, но здесь есть проблема доступа к людям. Самым лучшим надо платить колоссальные зарплаты — они все уже спокойно работают в Google и Apple, где их всё устраивает. То же самое в Москве и в Питере.

Минск показался нам самым оптимальным из всех городов СНГ для открытия офиса технологической компании. В Белоруссии, в России и на Украине очень сложно объяснить, что такое стартап. У людей абсолютно другое восприятие риска. К примеру, в Восточной Европе большинство программистов, которым мы предлагали опционы, говорили, что они им не нужны, а нужна большая зарплата. Это похоже на фабричное мышление: я прихожу на работу, отрабатываю смену, ухожу домой. 

 

Клиенты

У нас есть и корпоративные, и частные заказчики, их соотношение — примерно 60/40. Мы поддерживаем английский, испанский, португальский, китайский и японский языки. Русский и украинский языки сейчас в бета-версии — мы выполняем небольшое количество заказов на этих языках. Спрос на услуги транскрипции в России ещё пока формируется.

Расшифровка одной минуты аудиозаписи у нас стоит $1, если в записи присутствует голос только одного человека, и $2, если в записи участвуют двое и более людей. Заказы выполняются в течение двух рабочих дней.

 

Планы

Мы будем продолжать развивать нашу технологию, планируем добавлять в платформу новые языки. У нас сейчас много языков в бета-версиях. Станут ли они продуктами, будет зависеть от спроса.

К 2016 году мы планируем довести наш оборот до более чем $10 млн. Через два-три года, когда стоимость бренда TranscribeMe вырастет, компанию либо купят, либо она поднимет VC-раунд.

 

Советы

 

Надо учитывать, что вложения в новый бизнес составят в три раза больше, чем изначально думаешь.

Чтобы поднять $100 000, нужно столько же энергии и усилий, сколько для того, чтобы поднять миллион. Зачем тратить время, которого нет, чтобы собрать $100 000, если можно собрать сразу миллион?

 

Автор: Галина Шмелева