Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате |
Forums > Объявления > Требуются программеры |
Автор: LF_ - 12-04-2004, 04:54 |
![]() Народ, голову нашего хорошего друга |
Автор: Lab - 12-04-2004, 11:04 |
обсуждать тут? |
Автор: micha - 12-04-2004, 12:35 |
что то я не совсем понял ... а смысл ? |
Автор: Billy Bonce - 12-04-2004, 15:08 | ||
1 модуль- персональный портал новостей - нужная штука, аналоги написаны смысла изобретать велосипед нет ![]() назначение 2 и 3 модуля, я не понимаю... нафига пересылать *персональные* новости другим чувакам, да еще и требовать от них оценки ![]() |
Автор: XaBoK - 12-04-2004, 23:44 | ||
А зачем весь этот геморой? Ведь можно делать новости в формате XML используя словарь своих тэгов. Сделать под эти тэги "движок" на XSL и не париться с обрезаниями на javascript... CSS позволит сделать скин для новостей (и у каждого пользователя он будет свой). Кстати, с XML нет проблемы работать на разных языках и технологиях. А на чём собераются писать модули? |
Автор: obender - 13-04-2004, 07:01 | ||
Или просто использовать RSS, который собственно для этого и был создан, и для которого уже есть несчислимое количество читалок... |
Автор: imageman - 13-04-2004, 09:03 | ||||||
Примерно такую реакцию я и ожидал.... ![]()
новостями принято делиться ![]() Причем тут могут быть использованы самые разные алгоритмы. Например, статистический по формуле Байеса, самоорганизующиеся карты Кохонина, нейросети. Все эти методы способны обучаться на реальных новостях и делать прогноз для новых новостей ![]() В общем, девиз программы: больше хороших новостей |
Автор: imageman - 13-04-2004, 09:15 |
Важно! В начале сообщения не сказано, что программа будет работать про принципу p2p. Это означает, что интересная новость будет распространяться по цепочке пользователей. Небольшое добавление: новости могут не только выдираться из html страниц сайтов, но и писаться на клавиатуре журналистами (назовем их так). Т.е. никто не запрещает любому человеку, который набрел в сети на интересную страничку сделать copy-paste в Сороку, поставить флажок "Собирать статистику для новости" и нажать кнопку "Опубликовать". А потом сидеть и смотреть на счетчик ![]() Таким образом можно, например, сообщать о просмотренных фильмах, делать обзоры программ или уроки Фотошопа писать. Вот только фотки нужно будет где-то на просторах паутины размещать (что бы трафик лишний не создавать). И второе добавление: в Сороке будут передаваться не только интересные новости, но и неинтересные. И только новости, которые попадут в раздел СПАМ будут душиться на корню. Т.е. если Сорока для новости А присвоила категорию "не интересно", то эта новость может быть переслана другим пользователям сети Сорока, но в последнюю очередь. "Не интересная" новость будет показываться пользователю в самом конце списка. А интересные новости наоборот будут показываться вначале списка и, по желанию пользователя, будут появляться как всплывающее окошко. |
Автор: kuchin - 13-04-2004, 11:53 |
Я себе сделал программку MultiNews, она собирает новости из указанных источников (через RSS, или выдирая из html по regexp-маскам), группирует и позволяет удобно просматривать. К сожалению, single-user на данный момент. Но, по-крайней мере, могу поделиться "технологиями" ![]() |
Автор: micha - 14-04-2004, 00:24 |
и всё таки я не понял, в чём смысл этой программы. ДЛЯ ЧЕГО ? |
Автор: geng - 14-04-2004, 08:03 |
прочитав новости первым делом полез на форум для того чтобы задать вопрос по данному предложению, но оказалось что этот вопрос пришел в голову не только мне так НА КОЙ это нужно?!!! неужели вы думаете что это будет востребовано? |
Автор: imageman - 14-04-2004, 10:12 |
Давайте не будем разводить флейм. Я точно знаю, что свежие новости востребованы. В интернете появилось множество ресурсов, которые собирают новости. Главный недостаток этих ресурсов - нету персонификации пользователя. Т.е. на этих ресурсах (например на новостях от Яндекса) есть только разделение на общие темы (политика, технологии и пр.). Предлагаемый мною подход позволяет (за счет p2p) получить большой охват и (потенциально) большое колличество новостей. С другой стороны новости (статьи, обзоры) не будут захлестывать сплошным потоком. Из этого потока (в идеале) будут выбираться только интересные для _конкретного_ человека новости. До остальных новостей можно будет добраться вручную или, например, через поиск. В принципе сейчас хотелось бы найти одного-двух программеров, которые захотели бы сделать такую программу. Лично я, со своей стороны, могу сделать только один-два плагина для будущей прогаммы (не хватает опыта и времени). Предполагаемый язык Delphi или C++ (если делать в виде плагинов, то языки можно смешивать без проблем). Примеры новостных сайтов: http://pcnews.ru/cgi-bin/top20.pl (http://pcnews.ru/cgi-bin/top20.pl http://news.webdigest.ru/gate.top.html (http://news.webdigest.ru/gate.top.html http://www.setka.info/ (http://www.setka.info/ http://www.compulenta.ru/ (http://www.compulenta.ru/ http://news.battery.ru/#th3 (http://news.battery.ru/#th3 http://news.yandex.ru/hitech.html (http://news.yandex.ru/hitech.html http://rusc.ru/ (http://rusc.ru/ http://www.morenews.ru/ (http://www.morenews.ru/ |
Автор: micha - 14-04-2004, 14:42 |
как я смогу узнать, интересна ли мне новость, не прочитав оную ? я так понял, что "интересность" мне будет учреждена другими пользователями (или я не верно понял всёже), но какова гарантия, что однажды я не открою программу и не увижу там полторы сотни спам-новостей ? |
Автор: Pikachu - 14-04-2004, 15:35 | ||
Конечно свежие новости востребованы. Но на "новостных порталах" есть обычно подписка на новости по интересуюшчеи рубрике. Так зачем нужна p2p прога? Или я чего-то не понял? ![]() |
Автор: imageman - 14-04-2004, 15:47 | ||
твоя программа будет анализировать предыдущие сообщения и выделять, например, ключевые слова и выражения. Если в новости есть много "положительных" ключевых слов, то новость получает положительный рейтинг, а если ключевые слова характерны для спама, то рейтинг будет близок к нулю или отрицательный. Но это, можно так сказать, примитивная методика рейтингования (которая, тем не менее, может быть эффективна). Насчет спама - фильтроваться будет около 98% спама. Какая-то часть может, конечно, пройти - тут ничего не поделаешь. Но и в этом случае спам не будет широко распространяться. пример программы для борьбы со спамом http://www.keir.net/k9.html (http://www.keir.net/k9.html работает как POP3-proxy. Легко настраивается. Обучение занимает около 3-х дней, после чего ловит 98% спама. Ложныъ срабатываний (после обучения) практически нету. |
Автор: Pikachu - 14-04-2004, 15:48 | ||
Как ты себе ето пердставляеш? "Отрывать" картинки от инфы не очень удобно (ИМХО). Представь себе кто-то по новостям прислал тебе рецензию на фильм (текст), а если ты хочеш посмотреть картинки то будь добр загляни на саит такои-то. Не прошче ли сразу заглянуть на етот саит и не мучатся с "новостями"? ![]() |
Автор: Pikachu - 14-04-2004, 15:52 | ||
А хранить БАЗУ ЗНАНИИ у ПРЕДЫДУШЧИЕ НОВОСТИ где, на каком сервере? Ведь если мне пришлось переустановить ОС или пере-инсталлировать Сороку то все мои "знания "пропали. Нехорошо так ![]() |
Автор: imageman - 14-04-2004, 16:04 | ||||
новость будет ссылаться на какой-то www адрес. Т.е. внутри новости будет ссылка на картинку. Если новость оформлена как html, то никаких проблем. Я имел в виду, что для уменьшения траффика к новости не будет пристегнута картинка, а то так кто-нибудь догадается весь фильм пристегнуть. :-\ А база знаний и все остальные новости спокойно в десяток-другой мегабайт поместяться (со сжатием, конечно). У меня, например, папка с почтой зинамает 400 мегов - всякого хлама там!... ![]() |
Автор: Pikachu - 14-04-2004, 16:08 | ||
А что мне мешает сразу заити на етот WWW адресс и увидеть новость вместе с картинкои и не пользоватся Сорокои? ![]() |
Автор: Lab - 14-04-2004, 16:20 |
что-то тут на корню рубят идею, блин я не программер (в смысле не прикладник) но я потенциальный пользователь программы, вот... я предлагаю идейному вдохновителю сказать, где находится штаб разработчиков, потому как мне нужно куда-то сложить мысли |
Автор: Pikachu - 14-04-2004, 16:25 | ||
Не рубят, а пытаются разобраться в целесообразности затеи ![]() А мысли можно и здесь складывать, пускаи все голову ломают над ними. Мне было бы тоже интересно ... |
Автор: Lab - 14-04-2004, 16:31 |
я вот как-то вижу целесообразность ![]() а форум это не удобное место для складирования мыслей - они тут теряются... мне бы что-нить вроде Wikki или npj |
Автор: Pikachu - 14-04-2004, 16:38 | ||
Не хочу разводить флеим, но может ты как "потентцыалныи пользователь" выскажеш вслух свою точку зрения о целесообразности? Мне лично интересно услышать. Ведь сделать можно все что угодно если есть желание и ресурсы. Вопрос: а надо ли ето делать и для кого? ![]() |
Автор: imageman - 14-04-2004, 17:08 | ||||||
Если новость будет очень короткой (типа: "все сюда, здесь круто!"), то такая новость с большой вероятностью будет помечена как спам или малоинтересная (что соответствует действительности). Единстенное исключение будет в том случае, если отправитель зарекомендовал себя очень хорошо. Причем рейтинг не хранится на каком-нибудь сервере. Он вычисляется на вашей машине и никому не показывается. P.S. просьба писать только программистам и тем людям, которые имеют предложения по теме. |
Автор: Pikachu - 14-04-2004, 17:20 | ||
Так мы и пишем и пытаемся разобратся. |
Автор: Lab - 14-04-2004, 17:28 |
вот, урл я не забыл оказывается http://www.npj.ru/ (http://www.npj.ru/ тут можно приятно общаться по теме с удобствами, imageman - будешь там регистрироваться? All, кому интересно мое видение ![]() 1) RSS-ридеров в принципе полно, но никто меня не устраивает, поэтому в этом проекте можно решить свой шкурный вопрос и получить удобный ридер. 2) Я бы хотел делиться новостями и чтобы со мной делились, опять же - бегать по куче сайтов, собирать новости мне лень. Другой вопрос, кто будет класть туда эти новости, но я думаю что это можно решить (есть идея!) 3) А если прога будет подбирать новости по моим интересам - это вообще здорово ![]() |
Автор: Lab - 14-04-2004, 17:37 |
утопичная идея, возможно ее следует давить в самом зародыше: а коментарии к новостям будут? |
Автор: imageman - 14-04-2004, 17:43 | ||
принципиально - сделать можно. И даже, видимо, нужно. Видимо на комментарии нужно наложить какие-то ограничения и (конечно же) их тоже нужно пропускать через антиспамный фильтр. |
Автор: imageman - 14-04-2004, 18:57 | ||
зарегистрировался - будем разбираться там? адрес вроде как [http://www.npj.ru/soroka (http://www.npj.ru/soroka |
Автор: Проф.Плейшнер - 15-04-2004, 16:43 | ||
у меня есть вопросец прикладного характера. Если вы хотите сделать что вроде p2p клиента, а по описанию то что здесь написано это смахивает на Gnuttela, то вам придётся на эту програмулину подвесить некий протокольчик. А учитывая что не будет сервера, тогда этот протокольчик сам по себе станет более чем не тривиальной вешью. К примеру как два клиента смогут друг с дугом соеденится ? Или вы хотите пользовать что то из уже известных протоколов, скажем того же gnutella. |
Автор: Set - 15-04-2004, 17:51 |
Как заинтересованный в этой системе задам задачку: ![]() допустим хочу я получить софтверные новости с "хобота" с определённой даты, запускаю поиск по ентой p2p и получаю, что подобная инфа есть у, допустим, 200 человек и собрана она с помощью 10 разных шаблонов и причём данные, собранные одним и тем же шаблоном у разных юзверей, различаются. ![]() В результате получаем, скажем 50 версий одной и той же новости, причём т.к. рейтинг ставится от дуба (или по интересу), то определить качество новости (то бишь насколько она правильно вырезана из сайта и не потеряны-заменены в ней какие быквы-строки-фразы) - определить невозможно ... и даже если будут комменты, то им доверия особого тоже нет, да и время на их прочтение затрачу больше, чем если бы сам залез на сайт и нужную новость прочитал. Вывод прост: я не могу доверять новостям, собранным такой системой, их в любом случае придётся проверять. P.S. Делайте просто достойную замену WatzNew с нормальной поддержкой регулярных выражений и централизованной системой шаблонов - это действительно нужный проект. |
Автор: Lab - 16-04-2004, 08:42 |
Сет... я не думаю, что новости которые лежат в вебе постоянно нужно запихивать в систему р2р и гонять по сетке. ИМХО нужно передавать средствами р2р новости введенные самим пользователем. А для выдирания новостей с хобота нужно распространять не сами нвости, а шаблоны для модуля WatzNew или ссылки ны RSS каналы |
Автор: imageman - 16-04-2004, 08:58 | ||||
Нужно ли изобретать что-то свое или использовать уже изветсный протокол Gnutella? Я о гнутелле только слышал, но в сетевых протоколах я не разбирался (ни в одном).
Кстати, что ты подразумеваешь под "с нормальной поддержкой регулярных выражений"? |
Автор: Проф.Плейшнер - 16-04-2004, 09:09 |
а не проше ли написать plug-in к тому же eMule , как бы клиент уже готов, просто написать добавку к нему |
Автор: imageman - 16-04-2004, 13:04 |
eMule но поддерживает плагины. Или я не прав? К тому же сама сеть eDonkey не ориентирована на наши нужды (сеть оптимизирована для передичи больших файлов). К тому же одним плагином не обойтись - нужно написать чуть ли не десяток (!) плагинов. ( http://www.npj.ru/imageman/3661 (http://www.npj.ru/imageman/3661 ) Все здравые мысли можно писать сюда http://www.npj.ru/soroka (http://www.npj.ru/soroka P.S. туда писать только тем, кто реально хочет помочь, не следует туда писать "а зачем это нужно?" |
Автор: Set - 16-04-2004, 18:22 |
До меня кажется дошло, хотите сделать систему блогов на p2p, с неким уклоном на новости ?! ![]() И что значит "получать извещение", как это понять ? Можно столько извещений получить в неподходящий момент, что инет просто умрёт. ![]() Может "получать результаты своего поиска" ? |
Автор: Set - 16-04-2004, 18:48 | ||
98% - сказочки однако ![]() ![]() Отбор важных новостей - ещё одна проблема, если я захочу не пропустить ни одну новость по какой-то теме, то получу немерянную кучу лишнего хлама, если же жёстко резать фильтрами - будет немерянное число "дропов". "Цифровая подпись" - ... очень мило, будете создавать сертификационный центр что-ли ?! Муловская криптоидентификация тут не проканает. "Новости могут иметь комментарии": точно блог ![]() P.S. В общем хотелось бы прочитать об системе эти сообщений, кто кому когда что передаёт. Например "передавать в Сороку", как это понять, вроде данные каждого на локальной машине хранятся ... или планируется сделать распределённое хранение как в фреенете ? |
Автор: imageman - 16-04-2004, 19:41 | ||||||
А не будет ли слишком много сообщений? Можно десятикратно уменьшить нагрузку. Что для этого нужно сделать? Сорока должна сгенерировать случайное число от 0 до 1. Если число получится меньше 0.1, то Сорока отправляет пакет "Прочитал сообхение ХХХ". А компьютер поэта-журналиста число пакетов будет смело умножать на 10. |
Автор: Set - 16-04-2004, 20:01 | ||||
Иными словами каждое сообщение выпихивается в p2p и размножается всеми клиентами, так чтобы все пользователи его получили, т.е. идёт "информационная волна". Не будет ли так, что одновременное большое число таких сообщений просто напросто "зальёт" клиентов ? Ответные сообщения по сравнению с этим значительно безопаснее (размеры не те).
Читал. Оценки каждого юзверя будут хранится на локальной машине, вопрос: как собрать оценки по данной новости со всех пользователей сети ? Каскады запросов слать ? |
Автор: imageman - 17-04-2004, 15:48 | ||||
|
Автор: Set - 17-04-2004, 16:22 | ||||
О рейтинге новости кажись дошло ... он только для локального пользователя и для автора сообщения (если идёт сбор статистики).
Фильм - не новость, когда я включаю комп я хочу знать обо всех новостях. И тем более, об упомянутых в описании этого проекта статьях и т.п. Выходит после одной рассылки они просто исчезают - кто не успел...... ![]()
Если я правильно понимаю архитектуру FIDO, то она совсем для подобного проекта не подходит ... скорее тут ближе структура Usenet-а ... правда по моим прикидкам механизм ньюссерверов не проканает - требуются приличные обьёмы на дисках пользователей. |
Автор: Set - 18-04-2004, 17:44 | ||
Нашёл таки http://www.npj.ru/imageman/p2p (http://www.npj.ru/imageman/p2p ![]() При подобной системе требуется хранение у каждого клиента всех новостей и комментариев к ним за определённое время (скажем, за последние сутки). А размеры такого хранилища вполне могут достигать сотен мегабайт... |
Автор: imageman - 19-04-2004, 10:12 | ||
Бедут выглядеть это примерно так. 1. Привет! Я знаю ты хороший чувак. Передай мне список новостей за 4 дня, отсортированных по рейтингу. И укажи размеры каждой новости. 2. На тебе список: #450 (1 кб), #98 (456b) и т.д. 1. Давай мне ##450, 98, 48, 998..... Таким образом, например, при траффике 1 мегабайт в час (входящий) Сорока может выбрать трех человек. Первый выбранный человек предложит, к примеру, 1 мегабайт новостей. Скачаем от него 500. Второй предложит 650 килобайт новостей (часть уже будет скачана от первого). Скачаем от него 250. И от третьего скачаем еще 250. Для этого нужно ввести некую систему (локальную для каждого пользователя) рейтингования клиентов. Т.е. скачиваем новости от Ильича (к примеру), отсортированные по рейтингу. Читаем их. Оцениваем. Смотрим: если сортировка новостей, произведенная нами совпадает с сортировкой произведенных Ильичем, то Ильич имеет такие же вкусы, как и я. Если сортировка сильно не совпадает, то этот человек не очень нам подходит (вкусы разные). |
Автор: Set - 19-04-2004, 18:23 |
Каждый клиент должен участвовать в пересылке новостей и комментариев вне зависимости от их содержимого, на этом же вроде стоит вся сеть ? Но никакого контроля траффика я тут не вижу. Теперь об описанном выше обмене недостающими кусками при подключении в сеть: если, как описано, хранить не все новости и комменты за указанный период у каждого клиента, а только те, которые отфильтрованы по своим фильтрам этим же клиентом, то получим ситуацию "дыр". Будут отсутствовать как нужные новости, так и комментарии к ним ... а кому нужна система с рандомальной доставкой новостей ? Кого порадует, скажем, почтовый сервер, выкидывающий мейлы случайным образом ? ![]() |
Автор: Set - 05-05-2004, 08:49 |
Проект умер ? |
Автор: imageman - 05-05-2004, 09:06 | ||
Проект не умер. Для проекта у меня не хватает времени и сил, а другие люди не подключаются (даже на стадии советов). Если пересылать и хранить все новости, то такую систему зальет за несколько дней. Ведь всегда найжутся люди, которые из-за своей мелкой душонки захотят испортить что-то полезное! Именно поэтому нужно при проектировании сразу обращать внимание на таких людей. Именно поэтому новости получившие статус "спам" будут удаляться или (по крайеней мере) не будут пересылаться без особого требования. Именно поэтому пересылаться будут в первую очередь интересные письма, а потом уже всякий хлам. Как избежать "дыр"? Нужно сделать гибкую систему рейтингования. Нужно сделать так, чтобы твой клиент Сорока подключался к другому клиенту со схожими взглядами(интересами). Таким образом если повышается шанс на то, что какая-то новость интересная узкому кругу людей не будет потеряна. Т.е. из большого списка клиентов Сороки твоя сорока должна отобрать несколько человек, к которым нужно присоединиться в первую очередь, т.к. у них чаще всего есть интересующие тебя новости. Каким образом это сделать? Нужно подумать. Предлагайте свои алгоритмы! |
Автор: Set - 05-05-2004, 18:26 |
... -м-м-м- ... скажу так: смущает меня идея p2p в этом проекте. Во-первых сложно, во-вторых не слишком полезно (могу конечно ошибаться, но я очень сомневаюсь, что подобная система будет вообще нужна, не помешало бы исследовать эту тему). Другое дело востребованный конкурент для WatzNew - тут и поддержка плагинов, нормальные шаблоны, RSS, система генерации отчётов из собранных новостей, т.е. есть что реализовывать, где развернуться и создать проект любого масштаба (хоть коммерческий). Хорошая идея - это хорошая идея. ![]() |
Автор: imageman - 13-05-2004, 10:07 |
p2p компонент позволит (с одной стороны) потенциально получать больше хороших новостей, а (с другой стороны) не зависеть от какого-то сервера в сети. Кстати, довольно хорошая рассылка новостей идет на http://www.rusdoc.ru/last/ (http://www.rusdoc.ru/last/ (Русская компьютерная библиотека). Техническая реализация проекта "Сорока" пока неясна. Одно ясно: создавать нужно с рассчетом на плагины. |
Автор: imageman - 28-06-2004, 11:39 |
Google разрабатывает некую систему персонификации новостей. Конечно же для английских пользователей ![]() А слабо нам сделать достойный ответ??! |
Автор: imageman - 11-12-2005, 00:40 |
Ну, хоть мне и никто не смог помочь, но кое-какую программу я сделал: lit999.narod.ru (http://lit999.narod.ru/soft/40a/index.html Программа в стадии альфа и может использоваться только в образовательных целях ![]() ![]() |
Автор: FiL - 11-12-2005, 09:44 |
И ведь не долго заняло альфу написать ![]() Спасибо. Будем посмотреть при случае. |