Pages: (4) [1] 2 3 4  ( Show unread post )

   Требуются программеры
 LF_ Member is Offline
 Posted: 12-04-2004, 04:54 (post 1, #248875)

Hand of Doom
Forum moderator
Group: Roots
Posts: 17384

Народ, голову нашего хорошего друга ImageMan-a с дружественным визитом посетила следующая мысля: smile.gif

Есть идея по созданию программы обмена [интересными] новостями. Рабочее название "Сорока" (по русски "40А"). Вкратце:

      - Программа разделена на несколько модулей.
      - Первый модуль - аналог WatzNew. Этот модуль анализирует html страницы, которые задает пользователь и из этих страниц вытаскивает новости.
      - Второй модуль рассылает новости другим пользователям.
      - Третий модуль все новые новости проверяет по антиспаммерским технологиям + присваивает каждой новости рейтинг. Этот же модуль принимает от пользователя оценки новостям (вверху окошка с новостью будут три кнопки - "отлично/интересно", "безразлично/не интересно", "СПАМ"). Этот же модуль самообучается (на основе оценки конкретного пользователя).

Каждая новость имеет цифровую подпись. Делается это для того, чтобы "левые" люди (спаммеры, ламеры) не выдавали себя за своих чуваков.
При публикации новости в сеть можно поставить галочку "сбор статистики". В этом случае после прочтения новости удаленным пользователь на компьютер создателя новости уходит сообщение "Новость #xxx прочитана". И создатель новости может посмотреть сколько народу прочитало его новость. К каждой новости прикрепряется флаг, который определяет на каком языке новость (мне, например, не интересно читать на немецком). Новости, видимо, лучше оформлять как html текст. С обящательным вырезанием javascript и прочего.

За другими подробностями идеи или на мыло, или на аську 8997235


Вот такая идейка... Вообщем, все заинтересовавшиеся - милости просим к обсуждению. wink.gif

PM
Top Bottom
 Lab Member is Offline
 Posted: 12-04-2004, 11:04 (post 2, #248910)

freeman
Forum moderator
Group: Global Moders
Posts: 3140
обсуждать тут?
PM Email Poster Users Website ICQ
Top Bottom
 micha Member is Offline
 Posted: 12-04-2004, 12:35 (post 3, #248931)

Advanced

Group: Members
Posts: 399
Warn:0%-----
что то я не совсем понял ...

а смысл ?
PM Email Poster
Top Bottom
 Billy Bonce Member is Offline
 Posted: 12-04-2004, 15:08 (post 4, #248964)

Мембер

Group: Members
Posts: 3076
Warn:0%-----
QUOTE
    - Первый модуль - аналог WatzNew. Этот модуль анализирует html страницы, которые задает пользователь и из этих страниц вытаскивает новости.        - Второй модуль рассылает новости другим пользователям.        - Третий модуль все новые новости проверяет по антиспаммерским технологиям + присваивает каждой новости рейтинг. Этот же модуль принимает от пользователя оценки новостям (вверху окошка с новостью будут три кнопки - "отлично/интересно", "безразлично/не интересно", "СПАМ"). Этот же модуль самообучается (на основе оценки конкретного пользователя).


1 модуль- персональный портал новостей - нужная штука, аналоги написаны смысла изобретать велосипед нет wink.gif
назначение 2 и 3 модуля, я не понимаю...
нафига пересылать *персональные* новости другим чувакам, да еще и требовать от них оценки newest/fear2.gif

PM Email Poster
Top Bottom
 XaBoK Member is Offline
 Posted: 12-04-2004, 23:44 (post 5, #249106)

havoc player

Group: Members
Posts: 205
Warn:0%-----
QUOTE
аналоги написаны смысла изобретать велосипед нет

Велосипед всегда можно улучшить и переделать/доделать  wink.gif  
Вот у меня вопрос (ближе к телу):
QUOTE
Новости, видимо, лучше оформлять как html текст. С обящательным вырезанием javascript и прочего.

А зачем весь этот геморой? Ведь можно делать новости в формате XML используя словарь своих тэгов. Сделать под эти тэги "движок" на XSL и не париться с обрезаниями на javascript... CSS позволит сделать скин для новостей (и у каждого пользователя он будет свой).

Кстати, с XML нет проблемы работать на разных языках и технологиях. А на чём собераются писать модули?

This post has been edited by XaBoK on 12-04-2004, 23:48
PM Email Poster Users Website
Top Bottom
 obender Member is Offline
 Posted: 13-04-2004, 07:01 (post 6, #249159)

Newbie

Group: Members
Posts: 19
Warn:0%-----
QUOTE (XaBoK @ 12-04-2004, 15:44)
Сделать под эти тэги "движок" на XSL и не париться с обрезаниями на javascript... CSS позволит сделать скин для новостей (и у каждого пользователя он будет свой)

Или просто использовать RSS, который собственно для этого и был создан, и для которого уже есть несчислимое количество читалок...
PM Email Poster
Top Bottom
 imageman Member is Offline
 Posted: 13-04-2004, 09:03 (post 7, #249186)

Advanced

Group: Members
Posts: 254
Warn:0%-----
QUOTE (micha @ 12-04-2004, 11:35)
что то я не совсем понял ...
а смысл ?

Примерно такую реакцию я и ожидал.... smile.gif  Смысл именно в пункте "новость, полученную из модуля 1 (WatzNew) пересылаем другим пользователям".  Дело в том, что существует много регулярно обновляемых страничек, которые потенциально мне интересны. Но, во-первых, на многих из них я не бывал. А, во-вторых, дизайн страниц довольно часто меняется и бывает просто лень создавать новые правила для обновившихся страниц.  В данном случае прогдвинутые пользователи будут создавать правила для наиболее любимых страниц (причем только для нескольких) и эти за изменениями в дизайне этих нескольких страниц эти пользователи будут наблюдать. А все остальные (как продвинутые, так и новички-любители) будут всегда получать обновления.  Чтобы не получать чрезмерно много обновлений нужен обязательно модуль, который будет выкидывать явный хлам и сортировать оставшееся.  
QUOTE
просто использовать RSS
- такие каналы есть, но их не так много, как хотелось бы. Плюс к этому я не видел читалки, которые сортируют новости по шкале "привлекательно - не привлекательно".  
QUOTE
А зачем весь этот геморой? Ведь можно делать новости в формате XML используя словарь своих тэгов.
Вполне может быть. Я только поверхностно знаком с XML, но не вижу в этом формате особых достоинтв (я ошибаюсь?)  
QUOTE
CSS позволит сделать скин для новостей
- это обязательно  :)  
QUOTE
нафига пересылать *персональные* новости другим чувакам, да еще и требовать от них оценки


новостями принято делиться smile.gif А оценки не ты требуешь, а модуль анализа самого пользователя, чтобы потом на основе оценки "Новости A" поставить оценку "Новости Б". Т.е. для самообучения модуля анализа у удаленного пользователя ему нужно знать пристрастия пользователя.

Причем тут могут быть использованы самые разные алгоритмы. Например, статистический по формуле Байеса, самоорганизующиеся карты Кохонина, нейросети. Все эти методы способны обучаться на реальных новостях и делать прогноз для новых новостей newest/vertag.gif

В общем, девиз программы: больше хороших новостей
PM Email Poster Shared files Users Website ICQ
Top Bottom
 imageman Member is Offline
 Posted: 13-04-2004, 09:15 (post 8, #249189)

Advanced

Group: Members
Posts: 254
Warn:0%-----
Важно! В начале сообщения не сказано, что программа будет работать про принципу p2p. Это означает, что интересная новость будет распространяться по цепочке пользователей.


Небольшое добавление: новости могут не только выдираться из html страниц сайтов, но и писаться на клавиатуре журналистами (назовем их так). Т.е. никто не запрещает любому человеку, который набрел в сети на интересную страничку сделать copy-paste в Сороку, поставить флажок "Собирать статистику для новости" и нажать кнопку "Опубликовать". А потом сидеть и смотреть на счетчик smile.gif

Таким образом можно, например, сообщать о просмотренных фильмах, делать обзоры программ или уроки Фотошопа писать. Вот только фотки нужно будет где-то на просторах паутины размещать (что бы трафик лишний не создавать).

И второе добавление: в Сороке будут передаваться не только интересные новости, но и неинтересные. И только новости, которые попадут в раздел СПАМ будут душиться на корню. Т.е. если Сорока для новости А присвоила категорию "не интересно", то эта новость может быть переслана другим пользователям сети Сорока, но в последнюю очередь. "Не интересная" новость будет показываться пользователю в самом конце списка. А интересные новости наоборот будут показываться вначале списка и, по желанию пользователя, будут появляться как всплывающее окошко.
PM Email Poster Shared files Users Website ICQ
Top Bottom
 kuchin Member is Offline
 Posted: 13-04-2004, 11:53 (post 9, #249214)

Advanced

Group: Prestige
Posts: 286
Warn:0%-----
Я себе сделал программку MultiNews, она собирает новости из указанных источников (через RSS, или выдирая из html по regexp-маскам), группирует и позволяет удобно просматривать. К сожалению, single-user на данный момент. Но, по-крайней мере, могу поделиться "технологиями" smile.gif
PM Email Poster Users Website ICQ
Top Bottom
 micha Member is Offline
 Posted: 14-04-2004, 00:24 (post 10, #249559)

Advanced

Group: Members
Posts: 399
Warn:0%-----
и всё таки я не понял, в чём смысл этой программы.
ДЛЯ ЧЕГО ?
PM Email Poster
Top Bottom
 geng Member is Offline
 Posted: 14-04-2004, 08:03 (post 11, #249658)

Newbie

Group: Members
Posts: 4
Warn:0%-----
прочитав новости первым делом полез на форум для того чтобы задать вопрос по данному предложению, но оказалось что этот вопрос пришел в голову не только мне

так НА КОЙ это нужно?!!!

неужели вы думаете что это будет востребовано?
PM Email Poster ICQ
Top Bottom
 imageman Member is Offline
 Posted: 14-04-2004, 10:12 (post 12, #249685)

Advanced

Group: Members
Posts: 254
Warn:0%-----
Давайте не будем разводить флейм. Я точно знаю, что свежие новости востребованы. В интернете появилось множество ресурсов, которые собирают новости. Главный недостаток этих ресурсов - нету персонификации пользователя. Т.е. на этих ресурсах (например на новостях от Яндекса) есть только разделение на общие темы (политика, технологии и пр.).

Предлагаемый мною подход позволяет (за счет p2p) получить большой охват и (потенциально) большое колличество новостей. С другой стороны новости (статьи, обзоры) не будут захлестывать сплошным потоком. Из этого потока (в идеале) будут выбираться только интересные для _конкретного_ человека новости. До остальных новостей можно будет добраться вручную или, например, через поиск.

В принципе сейчас хотелось бы найти одного-двух программеров, которые захотели бы сделать такую программу. Лично я, со своей стороны, могу сделать только один-два плагина для будущей прогаммы (не хватает опыта и времени).

Предполагаемый язык Delphi или C++ (если делать в виде плагинов, то языки можно смешивать без проблем).

Примеры новостных сайтов:
http://pcnews.ru/cgi-bin/top20.pl
http://news.webdigest.ru/gate.top.html
http://www.setka.info/
http://www.compulenta.ru/
http://news.battery.ru/#th3
http://news.yandex.ru/hitech.html
http://rusc.ru/
http://www.morenews.ru/
PM Email Poster Shared files Users Website ICQ
Top Bottom
 micha Member is Offline
 Posted: 14-04-2004, 14:42 (post 13, #249728)

Advanced

Group: Members
Posts: 399
Warn:0%-----
как я смогу узнать, интересна ли мне новость, не прочитав оную ?
я так понял, что "интересность" мне будет учреждена другими пользователями (или я не верно понял всёже), но какова гарантия, что однажды я не открою программу и не увижу там полторы сотни спам-новостей ?
PM Email Poster
Top Bottom
 Pikachu Member is Offline
 Posted: 14-04-2004, 15:35 (post 14, #249744)

Просто прохожий

Group: Members
Posts: 4560
Warn:0%-----
QUOTE
Давайте не будем разводить флейм. Я точно знаю, что свежие новости востребованы. В интернете появилось множество ресурсов, которые собирают новости. Главный недостаток этих ресурсов - нету персонификации пользователя. Т.е. на этих ресурсах (например на новостях от Яндекса) есть только разделение на общие темы (политика, технологии и пр.).


Конечно свежие новости востребованы. Но на "новостных порталах" есть обычно подписка на новости по интересуюшчеи рубрике.
Так зачем нужна p2p прога? Или я чего-то не понял? rolleyes.gif



This post has been edited by Pikachu on 14-04-2004, 15:39

Attached Image (Click thumbnail to expand)
Attached Image
PM Email Poster ICQ
Top Bottom
 imageman Member is Offline
 Posted: 14-04-2004, 15:47 (post 15, #249756)

Advanced

Group: Members
Posts: 254
Warn:0%-----
QUOTE (micha @ 14-04-2004, 13:42)
как я смогу узнать, интересна ли мне новость, не прочитав оную ?

твоя программа будет анализировать предыдущие сообщения и выделять, например, ключевые слова и выражения.

Если в новости есть много "положительных" ключевых слов, то новость получает положительный рейтинг, а если ключевые слова характерны для спама, то рейтинг будет близок к нулю или отрицательный. Но это, можно так сказать, примитивная методика рейтингования (которая, тем не менее, может быть эффективна).

Насчет спама - фильтроваться будет около 98% спама. Какая-то часть может, конечно, пройти - тут ничего не поделаешь. Но и в этом случае спам не будет широко распространяться.

пример программы для борьбы со спамом
http://www.keir.net/k9.html
работает как POP3-proxy. Легко настраивается. Обучение занимает около 3-х дней, после чего ловит 98% спама. Ложныъ срабатываний (после обучения) практически нету.
PM Email Poster Shared files Users Website ICQ
Top Bottom
Topic Options Pages: (4) [1] 2 3 4