Стартап Kern AI занимается развитием платформы со вспомогательными инструментами для разработчиков NLP-моделей и специалистов по обработке данных. Она предназначена для упрощения процесса маркировки обучающих данных и автоматизации различных задач по их обработке.
На днях компания объявила о привлечении $2,9 млн в ходе посевного раунда финансирования, в котором приняли участие несколько венчурных фондов и частных инвесторов.
Технологии обработки естественного языка (Natural Language Processing, NLP) развиваются уже далеко не первый год, но за последние несколько месяцев интерес к ним значительно возрос из-за ажиотажа вокруг ChatGPT и его конкурентных языковых моделей. Вводя несколько ключевых слов в поле и мгновенно получая в ответ полноценный сгенерированный текст, пользователи не всегда задумываются, какая масштабная работа стоит за созданием таких моделей, начиная от первых этапов разработки и заканчивая доведением продукта до полноценного состояния, пригодного для массового использования.
Для создания NLP-моделей необходимы не только алгоритмы, но и массивы качественных обучающих данных, которые правильно промаркированы. Маркировка — это метод классификации необработанных данных, которые затем служат шаблонами для всестороннего обучения ИИ-модели.
Основанный в 2020 году стартап Kern AI разрабатывает инструменты для упрощения этого процесса — с их помощью разработчики могут быстрее обучать свои модели благодаря качественной маркировке данных. Так, флагманским продуктом компании является инструмент Refinery с открытым исходным кодом, который позволяет полуавтоматизировать процесс маркировки обучающих данных, выявлять среди них низкокачественные наборы и мониторить все данные в едином интерфейсе.
Еще одна разработка компании с открытым исходным кодом — инструмент Bricks, представляющий собой набор модульных стандартизированных “фрагментов кода”, которые разработчики могут интегрировать в свои инструменты по обработке данных для автоматизации различных процессов.
По заявлению стартапа, его инструментами уже пользуются специалисты в таких крупных компаниях, как Samsung и DocuSign.
Продукты стартапа, по словам его генерального директора Йоханнеса Хеттера, предназначены не только для создания больших языковых моделей, но и для автоматизации NLP-процессов в небольших компаниях. Например, Kern AI предлагает инструменты, которые помогают структурировать письменные заказы клиентов на основе языкового анализа и извлечения из них различного вида информации.
Полученное новое финансирование стартап планирует вложить в дальнейшее расширение своей платформы: например, компания собирается пополнить её инструментами для маркировки и обработки данных аудио-формата. Кроме того, в планы стартапа входит создание более узконаправленных продуктов для применения в конкретных отдельных отраслях.