> Сортировка строк
 Stackanovets Member is Offline
 Posted: 21-06-2015, 23:18 (post 1, #1106065)

Flooder

Group: News makers
Posts: 4285
Warn:0%-----
Есть текстовый файл, в котором много однострочных предложений, разделены обычным переводом строки.

Типа такого:

Гггггггг
Ввввввв
Ааааааа
Ббббббб


Нужно это дело отсортировать по алфавиту. Но ума не приложу как это сделать?
PM
Top Bottom
 mts Member is Offline
 Posted: 22-06-2015, 03:36 (post 2, #1106066)

штатный нетлабовский телепат

Group: News makers
Posts: 4832
Warn:0%-----
Excel.
PM Email Poster
Top Bottom
 inzerus Member is Offline
 Posted: 22-06-2015, 04:35 (post 3, #1106067)

Talk too much

Group: News makers
Posts: 2219
Warn:0%-----
Windows: в командной строке:

type file.txt | sort > sorted.txt
PM
Top Bottom
 FiL Member is Offline
 Posted: 22-06-2015, 17:37 (post 4, #1106074)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22872
QUOTE (inzerus @ 21-06-2015, 21:35)
Windows: в командной строке:

type file.txt | sort > sorted.txt
в *nix заменить type на cat.
PM Email Poster ICQ AOL MSN
Top Bottom
 Stackanovets Member is Offline
 Posted: 23-06-2015, 01:14 (post 5, #1106084)

Flooder

Group: News makers
Posts: 4285
Warn:0%-----
inzerus во, то что надо! :handup: Не думал что так просто будет. Думал нужны какието приблуды.
Отсортировало странно как-то, не совсем по алфавиту, но по крайней мере дубликаты нашло.

А в эксель не понял как загнать чтоб каждая строка в отдельной ячейке была. У меня эксель тот который у гугля Sheets или как он там.
PM
Top Bottom
 mts Member is Offline
 Posted: 23-06-2015, 01:50 (post 6, #1106086)

штатный нетлабовский телепат

Group: News makers
Posts: 4832
Warn:0%-----
Не знаю как у Гугля, но у МС просто бросаешь файл в Эксель.
PM Email Poster
Top Bottom
 FiL Member is Offline
 Posted: 23-06-2015, 16:08 (post 7, #1106092)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22872
QUOTE (Stackanovets @ 22-06-2015, 18:14)
inzerus во, то что надо! :handup: Не думал что так просто будет. Думал нужны какието приблуды.
Отсортировало странно как-то, не совсем по алфавиту, но по крайней мере дубликаты нашло.

А в эксель не понял как загнать чтоб каждая строка в отдельной ячейке была. У меня эксель тот который у гугля Sheets или как он там.
что значит "не совсем по алфавиту"? Может с локалью проблемы?

Ну или можно гнутый сорт попробовать из http://unxutils.sourceforge.net/

PM Email Poster ICQ AOL MSN
Top Bottom
 Stackanovets Member is Offline
 Posted: 25-06-2015, 00:21 (post 8, #1106138)

Flooder

Group: News makers
Posts: 4285
Warn:0%-----
QUOTE (FiL @ 23-06-2015, 16:08)
что значит "не совсем по алфавиту"? Может с локалью проблемы?
То и значит что сначала идёт буква Д... потом Н... потом опять Д..., вклинивается Х..., Ю..., потом опять Н.... Ну и в таком духе всё. Логика сортировки неясна. Но по крайней мере все дубликаты, там где строки полностью совпадают, вместе поскладывала. А это была вобщемто цель.
PM
Top Bottom
 FiL Member is Offline
 Posted: 25-06-2015, 05:35 (post 9, #1106140)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22872
странно. очень странно. никогда не встречал такого поведения.
а в какой кодировке файл?
PM Email Poster ICQ AOL MSN
Top Bottom
 Stackanovets Member is Offline
 Posted: 26-06-2015, 01:56 (post 10, #1106174)

Flooder

Group: News makers
Posts: 4285
Warn:0%-----
QUOTE (FiL @ 25-06-2015, 05:35)
странно. очень странно. никогда не встречал такого поведения.
а в какой кодировке файл?

1251 ANSI Cyr
PM
Top Bottom
 Brait Member is Offline
 Posted: 26-06-2015, 10:48 (post 11, #1106175)

Ответственный за БД
Group: Roots
Group: Roots
Posts: 3775
Такая сортировка получилась из-за путаницы с локалью.
Команда type file.txt | sort /l C > sorted.txt отсортирует кодировку Windows-1251 правильно, но буква Ё (из-за своей нестандартности) выбъется из сортировки и вылезет в начало файла...
PM
Top Bottom
 FiL Member is Offline
 Posted: 26-06-2015, 17:30 (post 12, #1106183)

Сварливый Мозг Клуба
Group: Roots
Group: Roots
Posts: 22872
ага, или переконвертировать в 866 и тогда отсортировать. Потом можно обратно отконвертить.
PM Email Poster ICQ AOL MSN
Top Bottom
Topic Options