> Regexp выдёргивания url-ов из html, требуется совет
 Set Member is Offline
 Posted: 22-03-2006, 23:27 (post 1, #572451)

Visionary

Group: Members
Posts: 5181
Warn:0%-----
Нужно вытаскивать адреса из html линков (<a href= ... >), а улучшайзингом регулярных выражений как-то не приходилось заниматься... :help: Есть ли готовое "стандартное" решение ?

ЗЫ Или может expat будет быстрее регулярных выражений ?
PM
Top Bottom
 muaddib Member is Offline
 Posted: 23-03-2006, 00:24 (post 2, #572494)

Kwizatz Haderach
Group: Netlab Soldier
Group: Netlab Soldier
Posts: 3553
Warn:0%-----
на каком языке? какая платформа? как часть апликации или отдельным скриптом?
PM ICQ Yahoo MSN
Top Bottom
 FiL Member is Offline
 Posted: 23-03-2006, 02:50 (post 3, #572555)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22892
лучше не надо улучшать. Оставь как есть. А то будет хуже. Проверено нетлабом. Тут тоже Брайт начал улучшать, так потом месяцами что-то криво парсилось.
PM Email Poster ICQ AOL MSN
Top Bottom
 izanoza Member is Offline
 Posted: 23-03-2006, 05:27 (post 4, #572590)

Мышъ с сыром

Group: Prestige
Posts: 5279
Warn:0%-----
Язык не указал, так что вот несколько:

<\s*a\s+[^>]*href\s*=\s*[\"']?([^\"' >]+)[\"' >]
http://www.onaje.com/php/article.php4/46

На яваскрипте пример тут
http://www.mikezilla.com/exp0033.html

тут ещё вариант
http://www.dotnetcoders.com/web/Learning/Regex/exHrefExtractor.aspx

для perl есть
http://search.cpan.org/~podmaster/HTML-LinkExtractor/LinkExtractor.pm
PM Email Poster
Top Bottom
 Set Member is Offline
 Posted: 23-03-2006, 22:12 (post 5, #572979)

Visionary

Group: Members
Posts: 5181
Warn:0%-----
QUOTE (izanoza @ 23-03-2006, 04:27)
тут ещё вариант
http://www.dotnetcoders.com/web/Learning/Regex/exHrefExtractor.aspx
Что-то да есть... спасибо. :hand:

Выражения на perl-овском диалекте.
PM
Top Bottom
Topic Options