Стартап. Как начать с нуля и изменить мир - страница 8

Шрифт

Интервал

Цены, между прочим, довольно щадящие. Понятно, что всё бывает по-разному, но очень примерно – 0,1–0,3 цента за запрос. Т. е. если привлечение нового пользователя стоит хотя бы рублей 30 и какая-нибудь распознавательная финтифлюшка увеличивает его вовлеченность или конверсию хотя бы процентов на 5, то это уже выгодно с запасом. А если 5 % нет, то и зачем оно?.. При этом маржа выглядит более чем достойно, если считать, скажем, запрос в секунду на ядро процессора, то каждое ядро приносит своим владельцам несколько сот долларов в день. Обратная сторона этой медали очевидна: для сайтов знакомств и подобных сервисов, где поиск лиц актуален на каждом клике, а не пару раз за жизнь, такой прайсинг может быть разорителен, но для них есть предложения по офлайн-SDK с фиксированной ценой.

В общем, в плане доступности технологии будущее уже наступило. Качеству есть еще куда расти, особенно в плане вычисления возраста и определения настроения, но для многих задач всё уже готово. Для иллюстрации: в Китае водитель Didi обязан иногда показывать таксометру свое лицо, чтобы доказать, что он – это действительно он, а не его знакомый на чужом подключении ездит.

Китайский Face++ – один из дюжины мировых проектов, называющих себя лидерами в технологии распознавания лиц. Впрочем, по венчурному финансированию Face++ точно среди лидеров, еще с предпоследнего раунда в 100 миллионов долларов. Зарабатывает компания в основном на контрактах с государством и крупными корпорациями, но и стартапчикам дает открытое API с онлайн-подключением и оплатой по карте.

Результаты бизнеса непрозрачны, масштаб новых интеграций оценить обычно трудно, но, судя по инвестициям, всё идет хорошо, в ноябре 2017 года Face++ получил почти полмиллиарда долларов по оценке в миллиард.

https://www.faceplusplus.com/

SOUNDHOUND

Еще одна внезапно решенная проблема – понимание простых фраз на естественном языке, что-то на уровне Siri или Cortana. Русский язык публично предлагает Яндекс, а сервисов для понимания английского или даже испанского в интернете просто много.

Не возьмусь утверждать, что стартап SoundHound – самый продвинутый из всех, но у него кроме технологии есть еще и ее собственные применения. Начнем с API. Сделан он правильно, с онлайн-регистрацией и открытым прайсом, без необходимости общения с сейлзами, но с бесплатным минимальным тарифным планом и преднастроенной демонстрацией технологии. Качество продукта объективно оценить сложно – что-то он понимает, что-то нет, процент успеха с очевидностью зависит от акцента говорящего, выбранной темы и просто везения, некое число типа «72 % верных ответов» не говорит ни о чем. Наверное, правильно было бы проверять его через детские тесты: «Разговаривает на уровне среднего ребенка 5 лет и 8 месяцев», – это была бы наиболее информативная оценка. Но, увы, сейчас могу только сказать, что субъективно по распознаванию звуков он примерно на уровне Nuance (это то, что в трех четвертях приложений с голосовым вводом используется), а по пониманию смысла – хоть и неожиданно хорош в простых предложениях, но запутаться может и в них. Сложносочиненные не берет ни в какую.

Следующая страница