Такое впечатление, что это написал журналист с бодунища, которому для поправки здоровья надо было срочно родить статью на NN строк. Проблемой создания семантического анализатора (того самого блока, который должен выявлять смысл сказанного/написанного) исследователи и программисты занимаются давно и упорно, и проблема заключается даже не в способе распознавания отдельных слов, фраз или "битов значений отдельных слов" (последняя фраза, видимо, результат ), а в том, что "смыслы" бывают разные и к окончательному решению, какой из них "основной", связывающий повествование, сами исследователи и программисты в своей среде до конца не пришли. Смысл автоматически исчезает, как только исчезает важность явления для того, кто обратил на это явление внимание. А появляется смысл в контексте конкретных проблем, которые решает индивидуум. Иными словами, смысл субъективен. Смыслов в тексте, не говоря об отдельном, изолированном предложении, может быть столько, сколько у этого текста/предложения нашлось читателей, а то и больше. Например, простейшая данность - совокупность предикатов, которые мы можем выявить путем грамматического разбора и логического анализа предложения; смысл, который может быть заложен в него в контексте продолжительного повествования (учитывая произнесенное ранее) или предыдущий опыт человечества (крылатые фразы, цитаты, афоризмы и т.д.). Мотивы человека в целом, которые, в том числе, побуждают его создавать тексты и говорить (психологические, а иногда и медицинские, клинические "смыслы" ). Иногда предложение - лишь весьма нестройный каркас для выражения эмоций по не относящейся явно к предмету обсуждения теме. Например: "Уже 12 часов! А ты до сих пор сидишь за компом. Ну и кто ты после этого?!" (не зная общего контекста, мы не выясним смысл произнесенного; даже зная его, возможно, потребуются уточнения смысла этих простых и понятных по отдельности фраз). В любом случае получить что-то законченное будет крайне сложно, на каком-то этапе произойдет расхождение в понимании текста. Собственно, семантические анализаторы, позволяющие более-менее успешно общаться с машиной на обычном языке, существуют давно (первые датируются, если память не изменяет, 70-ми годами; стало быть, бьются над этой задачей не 10 лет, а около 30). Компьютер успешно справлялся задачей грамматически безошибочного общения, и довольно уверенно разбирал предложения людей, умел худо-бедно поддерживать беседу (содержательная сторона которых была не на высоте, а подчас вообще отсутствовала). Неразрешенная проблема выявления доминанты (т.е. того, что автор хотел сказать своим текстовым посланием) существует до сих пор, и, как правило, к ее поискам даже не приступают (т.к. задача, мягко говоря, глобальная, и, на мой взгляд, упирается в культурологию), а просто ограничивают радиус "поиска смысла" прикладной проблемой, решение которой возлагается на прикладную программу. Например, перед созданием машинного перевода юзеру предлагается указать тип переводимого текста (художественный или специальный), а в некоторых поисковиках, снабженных подобием семантического анализатора (являющимся, правда, скорее продолжением анализатора синтаксического) пытаются выявить исключительно ключевое слово, по которому надо осуществлять первичный поиск (при этом семантика, как таковая, отсутствует - чаще всего анализируется статистика поисковых запросов и дальнейших переходов по ссылкам, часть из которых внесены в базу и заранее причислены к определенной "смысловой" категории).
|