Printable Version of Topic
Click here to view this topic in its original format
Forums > Сеть BitTorrent > Гуру торрента, а разъясните мне по поводу кодировки русских букв внутри торрент-файлов, глючу что-то я...


Posted by: FlyDrag on 18-12-2006, 12:34
Хранится ли внутри торрент-файла инфа о том в какой кодировке в нем записаны русские буквы? Собственно, используя клиента под юниксом, я столкнулся с традиционной проблемой, причем, судя по всему, на разных торрентах кодировка разная. Вот здесь (http://torrent.e2k.ru/details.php?id=8431&filelist=1#filelist эта кодировка, вроде win-1251, а вот здесь (http://torrent.e2k.ru/details.php?id=4401&filelist=1#filelist UTF-8, которую, походу, даже трекер корректно не отрабатывает. Кто-нибудь исследовал тему?

Posted by: bubamara on 18-12-2006, 13:16
Поддерживаю вопрос в свете того, что хочу в ближайшем будущем раздавать на трекере полный комплект ослорелизов Курехина, в 100% которых в оригинале присутствуют русские буквы. И как раз парюсь на тему надо ли переименовывать в ASCII.

Posted by: korneliy on 18-12-2006, 13:49
QUOTE (FlyDrag @ 18-12-2006, 10:34):
а вот здесь (http://torrent.e2k.ru/details.php?id=4401&filelist=1#filelist UTF-8, которую, походу, даже трекер корректно не отрабатывает. Кто-нибудь исследовал тему?
Только не надо про трекер - кодировку в броузере смени на UTF-8 и все будет видно. :)
Тему не исследовал, но в любом случае самый лучший выход - файлы с русскими названиями (если уж таковые должны быть) запаковать в архив и раздавать. Сам несколько раз переименовывал множество файлов, у которых побились русские имена при раздаче, - не понравилось.

Posted by: FlyDrag on 18-12-2006, 14:05
QUOTE (korneliy @ 18-12-2006, 13:49):
QUOTE (FlyDrag @ 18-12-2006, 10:34):
а вот здесь (http://torrent.e2k.ru/details.php?id=4401&filelist=1#filelist UTF-8, которую, походу, даже трекер корректно не отрабатывает. Кто-нибудь исследовал тему?
Только не надо про трекер - кодировку в броузере смени на UTF-8 и все будет видно. :)

До этого я догадался, ага. Только тогда остальной текст не видно, что и означает "корректно не отрабатывает". А уж что получилось у меня на файловой системе - страшно вспомнить, упарился переименовывать.

QUOTE (korneliy @ 18-12-2006, 13:49):
Тему не исследовал, но в любом случае самый лучший выход - файлы с русскими названиями (если уж таковые должны быть) запаковать в архив и раздавать. Сам несколько раз переименовывал множество файлов, у которых побились русские имена при раздаче, - не понравилось.

Мой интерес в следующем. Всех, кто создает раздачи, не переучишь, хотелось бы понять - нельзя-ли что-нибудь сделать на принимающей стороне:)

Posted by: veneamin on 18-12-2006, 14:13
Многое зависит от принимающего клиента. В мю у меня никаких проблем с русским не было.

Posted by: FiL on 18-12-2006, 19:36
QUOTE (korneliy @ 18-12-2006, 05:49):
Тему не исследовал, но в любом случае самый лучший выход - файлы с русскими названиями (если уж таковые должны быть) запаковать в архив и раздавать. Сам несколько раз переименовывал множество файлов, у которых побились русские имена при раздаче, - не понравилось.
Не поможет. Если запаковано под юниксом, а распаковывать на винде, то проблемы будут.
В торренте нет кодировки, как было на файловой системе, так и в торренте будет.

Posted by: elina817 on 18-12-2006, 19:40
У меня на англоязычной Винде не отображаются русские названия файлов в UTF-8 (он же Unicode). С файлами, запакованными в архив, всё-таки больше шансов получить удобоваримые названия :)

Posted by: Fellow on 18-12-2006, 20:04
Интересный вариант был бы переименовывать все названия в транслит и прикладывать к раздаче .bat и .sh скрипты, автоматически переименовывающие их обратно, если кому нужно.

Posted by: LF_ on 19-12-2006, 17:56
В торренте есть кодировка, там есть филда для этого (можно посмотреть TorrentSpy) и я даже видел, что некоторые создают два поля с именем - одно в UTF-8 другое скажем в 1251. Торренты азура имеют по два поля для имени и коментариев, сейчас не могу показать. Дальше как я понимаю зависит от клиента, какое именно поле он будет жрать. Но большая часть торрентов идет в UTF-8

Трекер не перекодирует кодировки для показа, ибо лень :)

EDIT: Могу :cool:

user posted image

Posted by: Сергей Иванович on 19-12-2006, 18:16
QUOTE (LF_ @ 19-12-2006, 16:56):
EDIT: Могу :cool:
"- Ну что ты, Петров, можешь?" ©

А слабо всё-таки сделать перекодировку для показа на трекере? :rolleyes:

Posted by: LF_ on 19-12-2006, 18:29
QUOTE (Сергей Иванович @ 19-12-2006, 10:16):
А слабо всё-таки сделать перекодировку для показа на трекере? :rolleyes:
На бесполезные фичи времени нет, а ты с полезными пристаёшь :rzhu:

Posted by: FiL on 19-12-2006, 20:54
QUOTE (LF_ @ 19-12-2006, 09:56):
В торренте есть кодировка, там есть филда для этого
вот оно как. Значит я был не прав :(

Posted by: FlyDrag on 24-12-2006, 19:34
QUOTE (LF_ @ 19-12-2006, 17:56):
В торренте есть кодировка, там есть филда для этого (можно посмотреть TorrentSpy) и я даже видел, что некоторые создают два поля с именем - одно в UTF-8 другое скажем в 1251. Торренты азура имеют по два поля для имени и коментариев, сейчас не могу показать. Дальше как я понимаю зависит от клиента, какое именно поле он будет жрать.

Понятно. В хорошую библиотечку (перловую желательно:) ) для разбора .torrent файла не ткнешь носом? Кхммм, хотя она одна вообще, походу... Net::Bittorrent::File.

QUOTE (LF_ @ 19-12-2006, 17:56):
Но большая часть торрентов идет в UTF-8

Понятно, будем посмотреть в клиенте на предмет перекодировки.

Posted by: LF_ on 24-12-2006, 23:47
Перл я увы, но могу сказать где нарыть на ПХП, С++, питоне, джаве :)

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)