Его уже назвали "священным Граалем" компьютерной технологии. Речь идет о программном обеспечении, которое позволит человеку общаться с компьютером "нормальным языком", точно так же, как люди общаются друг с другом.
Специалисты-компьютерщики во всем мире уже более десяти лет бьются над ускользающей целью, но пока безрезультатно. Однако на днях основанная в Иерусалиме компания Linguistic Agents сообщила о том, что ее специалистам удалось создать прикладную программу, которая позволит компьютерам понимать человеческую речь. Стоит ли говорить, что это приведет к настоящей революции в компьютерном мире.
Разработанная израильтянами "Усовершенствованная лингвистическая машина" или ALM (Advanced Language Machine) – детище основателя и главного управляющего компании Сэсона Маргалиота. 47-летний Маргалиот, изучавший лингвистику в Университете Калифорнии в Лос-Анджелесе и компьютерное дело в Еврейском университете в Израиле, потратил несколько лет на разработку программ для других компаний, прежде чем сосредоточил свое внимание на механизме, который мог бы точно раскодировать человеческую речь.
По его словам, нынешняя компьютерная лингвистика направлена на то, чтобы понять биты значения отдельных слов и то, что можно из них извлечь, вместо того, чтобы попробовать расшифровать значения во фразе или предложении. В противоположность этому предложенный американцами Наносинтаксис (NanoSyntax) опирается на то, что в основе понимания лежит наше общение на уровне фраз".
NanoSyntax, разработанный в 2004 году лингвистами из Технологического института Массачусетса, разложил язык на составляющие, выйдя за пределы слов, чтобы разобрать значения целых предложений. Именно эта идея и была положена в основу израильской разработки.
Компания Linguistic Agents успешно приспособила свое программное обеспечение, известное как "Интеллектуальный командный механизм", для использования в автобусной системе и справочнике "желтые страницы", хотя пока израильская программа не вышла на уровень коммерческого использования.
Источник
ТУТ
Lord KiRon
@ 06-01-2007, 14:34
Хм... есть большое подозрение что очередной стартап собирает бабки с лохов ...
VxWorks
@ 06-01-2007, 14:34
QUOTE |
биты значения отдельных слов |
Переведите на русский, плиз! :fear2:
Enot Pk
@ 06-01-2007, 15:06
QUOTE (VxWorks @ 06-01-2007, 14:34) |
QUOTE | биты значения отдельных слов |
Переведите на русский, плиз! :fear2: |
"Шо це за таке" по словарю С.И. Ожегова, с учётом возможного смысла.
Думаю, это.
На полях: хотя скорее как китайский иероглиф. Ведь имеется в виду лишь общий смысл слова.
У кого будет - в Ослик!
Доткомы наносят ответный удар! :D:
kmichael
@ 07-01-2007, 11:08
Классная реклама - "Весь вечер на манеже - ALM - пониматель слов, не то что с полу слова, а аж с полубита слова"
Кстати, а что такое бит слова, это куда?
А сколько может быть бит в слове йух наоборот?
И какое слово состоит из одного бита?
Lord KiRon
@ 07-01-2007, 11:14
Ну как ? Слово это WORD один WORD это 16 бит , значит один бит слова оттуда :) :diablo:
Enot Pk
@ 07-01-2007, 11:15
Опять же, если не ошибаюсь:
Бит - изначально удар палочкой по барабану.
Позже в прикладной физике - единица информации.
А ещё через некоторое время фундаментальные рукобл теоретики "догадались", что бит - это символ, единица информации.
И им на йух мнение прикладников, что это уже байт.
kmichael
@ 07-01-2007, 11:21
QUOTE (Enot Pk @ 07-01-2007, 10:15) |
И им на йух мнение прикладников, что это уже байт. |
Мне же лично кажется, что Йух - это уже гигабайт информации, причём самого что ни наесть прикладного характера.
Enot Pk
@ 07-01-2007, 11:31
QUOTE (kmichael @ 07-01-2007, 11:21) |
QUOTE (Enot Pk @ 07-01-2007, 10:15) | И им на йух мнение прикладников, что это уже байт. |
Мне же лично кажется, что Йух - это уже гигабайт информации, причём самого что ни наесть прикладного характера. |
:w00t: Фигась байты на НетЛабе!
PinkPa
@ 07-01-2007, 12:26
Такое впечатление, что это написал журналист с бодунища, которому для поправки здоровья надо было срочно родить статью на NN строк. :) Проблемой создания семантического анализатора (того самого блока, который должен выявлять смысл сказанного/написанного) исследователи и программисты занимаются давно и упорно, и проблема заключается даже не в способе распознавания отдельных слов, фраз или "битов значений отдельных слов" (последняя фраза, видимо, результат :drag: ), а в том, что "смыслы" бывают разные и к окончательному решению, какой из них "основной", связывающий повествование, сами исследователи и программисты в своей среде до конца не пришли. Смысл автоматически исчезает, как только исчезает важность явления для того, кто обратил на это явление внимание. А появляется смысл в контексте конкретных проблем, которые решает индивидуум. Иными словами, смысл субъективен. Смыслов в тексте, не говоря об отдельном, изолированном предложении, может быть столько, сколько у этого текста/предложения нашлось читателей, а то и больше. :) Например, простейшая данность - совокупность предикатов, которые мы можем выявить путем грамматического разбора и логического анализа предложения; смысл, который может быть заложен в него в контексте продолжительного повествования (учитывая произнесенное ранее) или предыдущий опыт человечества (крылатые фразы, цитаты, афоризмы и т.д.). Мотивы человека в целом, которые, в том числе, побуждают его создавать тексты и говорить (психологические, а иногда и медицинские, клинические "смыслы" ;) ). Иногда предложение - лишь весьма нестройный каркас для выражения эмоций по не относящейся явно к предмету обсуждения теме. Например: "Уже 12 часов! А ты до сих пор сидишь за компом. Ну и кто ты после этого?!" (не зная общего контекста, мы не выясним смысл произнесенного; даже зная его, возможно, потребуются уточнения смысла этих простых и понятных по отдельности фраз). В любом случае получить что-то законченное будет крайне сложно, на каком-то этапе произойдет расхождение в понимании текста. Собственно, семантические анализаторы, позволяющие более-менее успешно общаться с машиной на обычном языке, существуют давно (первые датируются, если память не изменяет, 70-ми годами; стало быть, бьются над этой задачей не 10 лет, а около 30). Компьютер успешно справлялся задачей грамматически безошибочного общения, и довольно уверенно разбирал предложения людей, умел худо-бедно поддерживать беседу (содержательная сторона которых была не на высоте, а подчас вообще отсутствовала). Неразрешенная проблема выявления доминанты (т.е. того, что автор хотел сказать своим текстовым посланием) существует до сих пор, и, как правило, к ее поискам даже не приступают (т.к. задача, мягко говоря, глобальная, и, на мой взгляд, упирается в культурологию), а просто ограничивают радиус "поиска смысла" прикладной проблемой, решение которой возлагается на прикладную программу. Например, перед созданием машинного перевода юзеру предлагается указать тип переводимого текста (художественный или специальный), а в некоторых поисковиках, снабженных подобием семантического анализатора (являющимся, правда, скорее продолжением анализатора синтаксического) пытаются выявить исключительно ключевое слово, по которому надо осуществлять первичный поиск (при этом семантика, как таковая, отсутствует - чаще всего анализируется статистика поисковых запросов и дальнейших переходов по ссылкам, часть из которых внесены в базу и заранее причислены к определенной "смысловой" категории).
Lord KiRon
@ 07-01-2007, 14:37
Понял что нужен "семантический анализатор" как для того чтоб прочитать оригинальную статью так и ответ PinkPa :diablo:
Enot Pk
@ 07-01-2007, 14:45
Проще говоря - когда идёт фраза "Иди на хрен" - это ещё можно понять, но когда она входит в состав сложного трёхэтажного логического выражения, зависимого от внешней функцмм логики собеседника/иного источника информации.
Ещё проще - нужно сопоставить что имелось в виду в каждом слове, затем в фразе, а затем и в предложении.... бешенный массив с уравнением и n*m неизвестных=)
heineken man
@ 07-01-2007, 14:59
Pinkpa
Проникся благоговейным трепетом на основе того немногого, что поддалось. :music:
QUOTE |
Иногда предложение - лишь весьма нестройный каркас для выражения эмоций по не относящейся явно к предмету обсуждения теме. Например: "Уже 12 часов! А ты до сих пор сидишь за компом. Ну и кто ты после этого?!" (не зная общего контекста, мы не выясним смысл произнесенного; даже зная его, возможно, потребуются уточнения смысла этих простых и понятных по отдельности фраз) |
:hi: :punk:
kmichael
@ 07-01-2007, 15:31
QUOTE (heineken man @ 07-01-2007, 13:59) |
Pinkpa Проникся благоговейным трепетом на основе того немногого, что поддалось. :music:
QUOTE | Иногда предложение - лишь весьма нестройный каркас для выражения эмоций по не относящейся явно к предмету обсуждения теме. Например: "Уже 12 часов! А ты до сих пор сидишь за компом. Ну и кто ты после этого?!" (не зная общего контекста, мы не выясним смысл произнесенного; даже зная его, возможно, потребуются уточнения смысла этих простых и понятных по отдельности фраз) |
:hi: :punk: |
Да! Это как у Задорного - "Только русский человек, восхищаясь красотой заката, матерится"