Pages: (2) 1 [2] ( Show unread post )

> http://p2p.lib.ru/
 veneamin Member is Offline
 Posted: 29-11-2004, 11:00 (post 16, #326602)

Медведь-потаскун

Group: Prestige
Posts: 2822
Warn:0%-----
Наличие дублей - не самая большая проблема, имхо. В конце концов, если мне на запрос "скачать Винни-Пуха" придут не одна книга в чистом тексте, а пусть даже 10 вариантов (doc, pdf, htm и т.д.) - это мне даже на пользу может быть, в конце концов трафик мизерный, не фильмы качаем же.
А вот возможность найти и скачать нужное, а не весь архив - вот это да, это важно.
PM Email Poster Shared files ICQ
Top Bottom
 BRMAIL Member is Offline
 Posted: 29-11-2004, 15:55 (post 17, #326657)

Advanced

Group: Members
Posts: 375
Warn:0%-----
QUOTE (FiL @ 28-11-2004, 21:53)
А как привыкли? По-моему литераторы никак не привыкли. И главное, никто не будет качать многомегабайтные архивы, если нужна одна книжка. И когда вышла новая книга, то она должна как-то появляться в сети. А не ждать следующего глобального апдейта. Ну и далее в таком разрезе.

а литераторы тут не при чем. Как например непричем киношники к фильмам которые здесь раздаются. И таки да, добаление книг врядли будет автоматическим и универсальным.Это все ручная работа. Дело в том, что книги появляются в базах библиотек хитрыми путями и неавтоматическими. И рассчитывать на "механизацию" не стоит.
У нас классическое противоречие постановки задачи.
С одной стороны p2p сеть для распостранения книг должна быть массовой. С другой стороны заточенной под книги, под раздачу и КАТАЛОГИЗАЦИЮ
Писать под это особый p2p софт? Ну не знаю, не знаю.
PM
Top Bottom
 BRMAIL Member is Offline
 Posted: 29-11-2004, 16:03 (post 18, #326661)

Advanced

Group: Members
Posts: 375
Warn:0%-----
QUOTE (piligrim @ 29-11-2004, 00:31)
проблема дублей решится с составлением базы данных. при скачивании каждой новой книги надо будет проверять нет ли ее в базе данных.

Проблема дублей не решается на уровне "Сравнить автора и сравнить название, если совпало - дубль"
Я молчу про переводы, где кадый переводчик намутил по своему (и информации о переводчике в файле может не быть) Могут быть переиздания книги, когда она частично разная в первом и втором издании. Мгут попасться невычитанные после скана книги, а через пару месяцев те же самые но вычитанные. Могут быть различные форматы книг. Скажем отсканили без форматирования - выложили, через месяц кто то отсканил и распознал более качественно, буква "Ё" всюду с точками, картинки на местах. Ну и лезет тебе этот документ в базу, какой выберешь? Первый или второй ? Один тебе скажет картинки нафиг не нужны, дургой скажет как же, второй определённо лучше.
Короче, легко и изящно вопрос решается с "анной карениной" и "что делать"
А масса современных книг будут проблемными.
И формат хранения не решает проблем, а только добавляет.

PM
Top Bottom
 FiL Member is Offline
 Posted: 29-11-2004, 18:54 (post 19, #326714)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22869
QUOTE (BRMAIL @ 29-11-2004, 06:55)
а литераторы тут не при чем. Как например непричем киношники к фильмам которые здесь раздаются.

Под "литераторами" я имел в виду не писателей, а людей, занимающихся сбором, каталофгизацией и распространением книг. То есть такие-же литераторы, как тут киношники и музыканты.

А насчет добавления книг... если не дать возможность каждому, кто имеет источник новых книг, добавлять их в "библиотеку", то он просто откроет свою библиотеку и будет в ней сидеть. Что сейчас и происходит. Если мы хотим создать нечто объединяющее всех, то оно должно быть удобным и для читателей и для контрибьютеров. И не просто удобным, а удобнее, чем все существующее.
PM Email Poster ICQ AOL MSN
Top Bottom
 piligrim Member is Offline
 Posted: 29-11-2004, 21:00 (post 20, #326755)

Иной

Group: Prestige
Posts: 14584
Warn:0%-----
QUOTE (BRMAIL @ 29-11-2004, 08:03)
QUOTE (piligrim @ 29-11-2004, 00:31)
проблема дублей решится с составлением базы данных. при скачивании каждой новой книги надо будет проверять нет ли ее в базе данных.

Проблема дублей не решается на уровне "Сравнить автора и сравнить название, если совпало - дубль"
Я молчу про переводы, где кадый переводчик намутил по своему (и информации о переводчике в файле может не быть) Могут быть переиздания книги, когда она частично разная в первом и втором издании. Мгут попасться невычитанные после скана книги, а через пару месяцев те же самые но вычитанные. Могут быть различные форматы книг. Скажем отсканили без форматирования - выложили, через месяц кто то отсканил и распознал более качественно, буква "Ё" всюду с точками, картинки на местах. Ну и лезет тебе этот документ в базу, какой выберешь? Первый или второй ? Один тебе скажет картинки нафиг не нужны, дургой скажет как же, второй определённо лучше.
Короче, легко и изящно вопрос решается с "анной карениной" и "что делать"
А масса современных книг будут проблемными.
И формат хранения не решает проблем, а только добавляет.

ну мне достаточно что книга есть. неважно какого издания и какого перевода. если еще на это смотреть то ты никогда из этого не вылезешь. насчет форматов, я держу все книги в фомате txt. это наиболее распространенный формат в сети и более удобный так как для чтения не требует установки дополнительных программ.
насчет буквы "ё" то да бывает не та буква отпечатывается. но я как -то привык читать с опечатками и не обращаю на это внимания.
PM ICQ
Top Bottom
 nsl Member is Offline
 Posted: 29-11-2004, 22:10 (post 21, #326777)

Студент
Group: SpaceBalls
Group: SpaceBalls
Posts: 1649
Warn:0%-----
Кто то должен заниматься каталогом и архивом. Иначе ничего не выйдет.
PM Email Poster
Top Bottom
 BRMAIL Member is Offline
 Posted: 29-11-2004, 23:37 (post 22, #326799)

Advanced

Group: Members
Posts: 375
Warn:0%-----
QUOTE (FiL @ 29-11-2004, 09:54)
А насчет добавления книг... если не дать возможность каждому, кто имеет источник новых книг, добавлять их в "библиотеку", то он просто откроет свою библиотеку и будет в ней сидеть. Что сейчас и происходит. Если мы хотим создать нечто объединяющее всех, то оно должно быть удобным и для читателей и для контрибьютеров. И не просто удобным, а удобнее, чем все существующее.

Я не против, просто это все наши мечты. Вот тебе бывшая библиотека Бомануара, Они сканают, вычитывают, выкладывают. Что владельцы сайта горят желанием делиться? Отнюдь, отнюдь. Сильно обижаются на другие порталы, которые у них книги "воруют".
Тяжело это. В самом деле я тебе с ходу назову способ пополнения библиотеки. Простой и изящный. Открыть ящик на гугле. И раздать этот адрес всем-всем. В сабже письма должен стоять обязательный префикс например /NEWBOOK/ Таким образм отсекаем явный спам. А он будет. Аттачем идет книга. В теле письма коментарии , анонсы, что угодно .
Обновлять базу в P2P можно хоть ежедневно. Набрался архив 10 мег - пошло обновление.
Организовать страничку или топик где оно будет лежать можно тоже где угодно или дубли сразу в 3-4 местах.
По прежнему - проблема в разгребании существующего. И если в FB2 книжки - 2 библиотеки поддаются достаточно легкой систематизации, то остальное :-(

This post has been edited by BRMAIL on 29-11-2004, 23:41
PM
Top Bottom
 FiL Member is Offline
 Posted: 30-11-2004, 01:02 (post 23, #326820)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22869
на the-ebook Slawa-614 ( http://rusf.ru ) расписывал сколько книг пробегает ежедневно через фидошную фэху. Там одному не разгрести никак. А если собирать еще с других мест....
А насчет того, что никто делиться не хочет - абсолютная правда. И Бонамуар и Альдебаран - никто не делится и не интересуется. Вот потому-то и надо сделать нечто, что заинтересует. А просто книжки раздавать - так им таки да не интересно.
PM Email Poster ICQ AOL MSN
Top Bottom
 piligrim Member is Offline
 Posted: 30-11-2004, 01:55 (post 24, #326830)

Иной

Group: Prestige
Posts: 14584
Warn:0%-----
для ведения катлога я пользуюсь этой прогой. достаточно удобна и бесплатна

описание здесь

user posted image

скачать здесь
PM ICQ
Top Bottom
 BRMAIL Member is Offline
 Posted: 30-11-2004, 02:01 (post 25, #326832)

Advanced

Group: Members
Posts: 375
Warn:0%-----
Я тут пару месяцев назад потестил бук дизайнер, или что то в этом духе. Натравил его на фолдер с библиотекой фикшн бук и попросил подобрать все fb2 файлы. Он задумался на 20 минут, а потом молча упал.
На половину библиотеки его хватило - но подтормаживал в работе. И это только fb2 - самый структурируемый из всех книжных форматов - читай xml и пищи в базу.

Опять таки, софт для ведения библиотеки для "себя любимого" - две ну три книги в неделю, или для сохранения "большого каталога" на 10 гигабайт файлов - вещи сильно разные.
PM
Top Bottom
 piligrim Member is Offline
 Posted: 30-11-2004, 02:14 (post 26, #326835)

Иной

Group: Prestige
Posts: 14584
Warn:0%-----
BRMAIL

ты же писал что в этих 10 гигах много дублей. то есть учитывая что ты собирал это с разных библиотек и то что в этих библиотеках многие книги повторяются дублей этих у тебя много и реально книг у тебя максимум 3 гига а не 10. у меня 700 мега книг в зипе в формате txt. качал я не все подряд и в основном романы и повести. то есть маленькие расказики весом меньше 90к я не качал. я их не читаю. я подстчитывал как-то и оказалось что у меня 3.000 книг фантастики и около 2000 остального.
PM ICQ
Top Bottom
 BRMAIL Member is Offline
 Posted: 30-11-2004, 03:18 (post 27, #326843)

Advanced

Group: Members
Posts: 375
Warn:0%-----
QUOTE (piligrim @ 29-11-2004, 17:14)
BRMAIL

ты же писал что в этих 10 гигах много дублей. то есть учитывая что ты собирал это с разных библиотек и то что в этих библиотеках многие книги повторяются дублей этих у тебя много и реально книг у тебя максимум 3 гига а не 10. у меня 700 мега книг в зипе в формате txt. качал я не все подряд и в основном романы и повести. то есть маленькие расказики весом меньше 90к я не качал. я их не читаю. я подстчитывал как-то и оказалось что у меня 3.000 книг фантастики и около 2000 остального.

3 гига не может получится, так как только мошковская библиотека занимает 4.6 гига. а книги там не повторяются.
Плюс вякая фантстика из разных библиотек, солянка упавшая из фидошных эх. Короче меньше чем на пять- шетсть гиг не тянет просто никак.
Это очень много. ДАже если просто пробежаться глазами по названиям.
PM
Top Bottom
 FiL Member is Offline
 Posted: 30-11-2004, 07:10 (post 28, #326856)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22869
QUOTE (BRMAIL @ 29-11-2004, 18:18)
3 гига не может получится, так как только мошковская библиотека занимает 4.6 гига. а книги там не повторяются.
Плюс вякая фантстика из разных библиотек, солянка упавшая из фидошных эх. Короче меньше чем на пять- шетсть гиг не тянет просто никак.
Это очень много. ДАже если просто пробежаться глазами по названиям.

Toт-же Slawa в DC расшарил свою очень хорошо документированную базу - более 6 Гиг. И у него есть не все, что есть вообще. То есть надо расчитывать на 10 гиг файлов в txt. Это таки много.
PM Email Poster ICQ AOL MSN
Top Bottom
Topic Options Pages: (2) 1 [2]