Forums -> Сеть BitTorrent -> Гуру торрента, а разъясните мне по поводу кодировки русских букв внутри торрент-файлов
| Full Version

FlyDrag
Хранится ли внутри торрент-файла инфа о том в какой кодировке в нем записаны русские буквы? Собственно, используя клиента под юниксом, я столкнулся с традиционной проблемой, причем, судя по всему, на разных торрентах кодировка разная. Вот здесь эта кодировка, вроде win-1251, а вот здесь UTF-8, которую, походу, даже трекер корректно не отрабатывает. Кто-нибудь исследовал тему?
bubamara
Поддерживаю вопрос в свете того, что хочу в ближайшем будущем раздавать на трекере полный комплект ослорелизов Курехина, в 100% которых в оригинале присутствуют русские буквы. И как раз парюсь на тему надо ли переименовывать в ASCII.
korneliy
QUOTE (FlyDrag @ 18-12-2006, 10:34)
а вот здесь UTF-8, которую, походу, даже трекер корректно не отрабатывает. Кто-нибудь исследовал тему?
Только не надо про трекер - кодировку в броузере смени на UTF-8 и все будет видно. :)
Тему не исследовал, но в любом случае самый лучший выход - файлы с русскими названиями (если уж таковые должны быть) запаковать в архив и раздавать. Сам несколько раз переименовывал множество файлов, у которых побились русские имена при раздаче, - не понравилось.
FlyDrag
QUOTE (korneliy @ 18-12-2006, 13:49)
QUOTE (FlyDrag @ 18-12-2006, 10:34)
а вот здесь UTF-8, которую, походу, даже трекер корректно не отрабатывает. Кто-нибудь исследовал тему?
Только не надо про трекер - кодировку в броузере смени на UTF-8 и все будет видно. :)

До этого я догадался, ага. Только тогда остальной текст не видно, что и означает "корректно не отрабатывает". А уж что получилось у меня на файловой системе - страшно вспомнить, упарился переименовывать.

QUOTE (korneliy @ 18-12-2006, 13:49)
Тему не исследовал, но в любом случае самый лучший выход - файлы с русскими названиями (если уж таковые должны быть) запаковать в архив и раздавать. Сам несколько раз переименовывал множество файлов, у которых побились русские имена при раздаче, - не понравилось.

Мой интерес в следующем. Всех, кто создает раздачи, не переучишь, хотелось бы понять - нельзя-ли что-нибудь сделать на принимающей стороне:)
veneamin
Многое зависит от принимающего клиента. В мю у меня никаких проблем с русским не было.
FiL
QUOTE (korneliy @ 18-12-2006, 05:49)
Тему не исследовал, но в любом случае самый лучший выход - файлы с русскими названиями (если уж таковые должны быть) запаковать в архив и раздавать. Сам несколько раз переименовывал множество файлов, у которых побились русские имена при раздаче, - не понравилось.
Не поможет. Если запаковано под юниксом, а распаковывать на винде, то проблемы будут.
В торренте нет кодировки, как было на файловой системе, так и в торренте будет.
elina817
У меня на англоязычной Винде не отображаются русские названия файлов в UTF-8 (он же Unicode). С файлами, запакованными в архив, всё-таки больше шансов получить удобоваримые названия :)
Fellow
Интересный вариант был бы переименовывать все названия в транслит и прикладывать к раздаче .bat и .sh скрипты, автоматически переименовывающие их обратно, если кому нужно.
LF_
В торренте есть кодировка, там есть филда для этого (можно посмотреть TorrentSpy) и я даже видел, что некоторые создают два поля с именем - одно в UTF-8 другое скажем в 1251. Торренты азура имеют по два поля для имени и коментариев, сейчас не могу показать. Дальше как я понимаю зависит от клиента, какое именно поле он будет жрать. Но большая часть торрентов идет в UTF-8

Трекер не перекодирует кодировки для показа, ибо лень :)

EDIT: Могу :cool:

user posted image
Сергей Иванович
QUOTE (LF_ @ 19-12-2006, 16:56)
EDIT: Могу :cool:
"- Ну что ты, Петров, можешь?" ©

А слабо всё-таки сделать перекодировку для показа на трекере? :rolleyes:
LF_
QUOTE (Сергей Иванович @ 19-12-2006, 10:16)
А слабо всё-таки сделать перекодировку для показа на трекере? :rolleyes:
На бесполезные фичи времени нет, а ты с полезными пристаёшь :rzhu:
FiL
QUOTE (LF_ @ 19-12-2006, 09:56)
В торренте есть кодировка, там есть филда для этого
вот оно как. Значит я был не прав :(
FlyDrag
QUOTE (LF_ @ 19-12-2006, 17:56)
В торренте есть кодировка, там есть филда для этого (можно посмотреть TorrentSpy) и я даже видел, что некоторые создают два поля с именем - одно в UTF-8 другое скажем в 1251. Торренты азура имеют по два поля для имени и коментариев, сейчас не могу показать. Дальше как я понимаю зависит от клиента, какое именно поле он будет жрать.

Понятно. В хорошую библиотечку (перловую желательно:) ) для разбора .torrent файла не ткнешь носом? Кхммм, хотя она одна вообще, походу... Net::Bittorrent::File.

QUOTE (LF_ @ 19-12-2006, 17:56)
Но большая часть торрентов идет в UTF-8

Понятно, будем посмотреть в клиенте на предмет перекодировки.
LF_
Перл я увы, но могу сказать где нарыть на ПХП, С++, питоне, джаве :)