Обработка естественного языка. Виды, применение

1 сентября 2021

Обработка естественного языка. Виды, применение

1 сентября 2021

Обработка естественного языка (NLP — Natural language processing) — область науки на стыке информатики и лингвистики. Цель этого направления: научить компьютер понимать естественные языки — те, на которых говорят и пишут люди: русский, английский, французский и так далее. Рассмотрим, какие подразделы NLP бывают.


Чат-боты

Основаны на системе правил, построенных с помощью машинного обучения. А это значит, что чем больше скриптов разговоров будет использовано для обучения системы, тем эффективнее будет бот: давать более точные ответы, более правдоподобно имитировать общение с реальным человеком. Проще говоря — чат-бот — инструмент распознавания письменной речи.

Распознавание устной речи

Данная технология применяется для различных задач. Распознавание уникального тембра может служить биометрической проверке: только после подтверждения достоверности голоса возможен доступ к конфиденциальным файлам на ПК. С помощью голоса также можно управлять функцией поиска на смартфонах и умных станциях. И, наконец, технология применяется для трансформации устного текста в письменный.

Синтез речи

Способность компьютера воспроизводить человеческую речь — отдельные фонемы и слова. Первым в мире подобным устройством считается VODER на ручном управлении (1930 год). Сейчас мы слышим роботизированные голоса Siri, Cortana, Alexa, и это пример того, как продвинулась технология к настоящему времени.

Рамиль Кулеев, директор Института искусственного интеллекта:

— Одна из проблем при работе с естественными языками — их изменчивость. Они постоянно развиваются, кроме того, различаются в зависимости от территории применения, темы, жанра... В то время как компьютеру нужны четкие, структурированные данные. Однако машинное обучение на основе датасета из многочисленных разговоров приводит к большей гибкости систем.

В Университете Иннополис мы также реализуем проект на основе технологии анализа естественного языка (NLP). Разрабатываем цифровую платформу для поиска, анализа и управления научно-технической информацией. Ее цель — управление данными о НИОКР, включая автоматизированный сбор и анализ информации, выявление тенденций в развитии технологий для принятия управленческих решений по выбору направлений реализации НИОКР, семантический поиск, планирование проведения НИОКР и решение других задач.

Решение поможет ускорить работу аналитиков и специалистов по интеллектуальной собственности. Сервис осуществляет автоматический мониторинг электронных источников отраслевой информации, извлекает данные для оценки результативности НИОКР, формирует технологические карты для выявления оптимальных маршрутов решения научно-технических задач.