Gentoo Forums
Gentoo Forums
Gentoo Forums
Quick Search: in
Дружат ли UTF8 и консоль?
View unanswered posts
View posts from last 24 hours

Goto page 1, 2  Next  
Reply to topic    Gentoo Forums Forum Index Russian
View previous topic :: View next topic  
Author Message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Sun Jan 30, 2005 7:47 pm    Post subject: Дружат ли UTF8 и консоль? Reply with quote

Пошукал по форуму и понял, что многие консольные программы не работает в utf8. Но хотелось бы узнать конкретно про эти: centericq, mutt, vim, tin, slrn, irssi, bitchx? Ну раз в debian-е появился пакет centericq-utf8, значит centericq под utf8 завести всё-таки можно :), а другие программы как?

Только не советуйте запускать программы в терминале с любой другой локалью, я про этот способ всегда помню, но хочется простой консоли :).

Почему utf8? потому что по работе приходится иметь дело с файлами, в названиях которых есть немецкие умлауты.

За ссылки на другие треды, где это уже обсуждалось (я мог и пропустить в поиске), буду очень благодарен.
_________________
wbr!
Back to top
View user's profile Send private message
viy
Veteran
Veteran


Joined: 03 Jul 2004
Posts: 1580
Location: Riga, Latvia

PostPosted: Mon Jan 31, 2005 7:54 am    Post subject: Reply with quote

vim, mutt --- да! я их пользую всю дорогу. centericq и irssi вроде тоже, но не отвечаю --- я пока только хочу на них пересесть.
Back to top
View user's profile Send private message
UTSL
n00b
n00b


Joined: 19 Jan 2005
Posts: 10

PostPosted: Mon Jan 31, 2005 10:55 am    Post subject: Reply with quote

centericq работает
emacs работает
irssi тоже работает
_________________
Use The Source, Luke
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Mon Jan 31, 2005 5:35 pm    Post subject: Reply with quote

А кто из шеллов лучше справляется с utf8? опять же из форумов понял, что zsh косячит сильнее, чем bash. Какие грабли с utf8 у bash?
_________________
wbr!
Back to top
View user's profile Send private message
viy
Veteran
Veteran


Joined: 03 Jul 2004
Posts: 1580
Location: Riga, Latvia

PostPosted: Mon Jan 31, 2005 6:29 pm    Post subject: Reply with quote

danzz wrote:
Какие грабли с utf8 у bash?

У последнего из 2-ой ветки (у меня GNU bash, version 2.05b.0(1)-release) такой глюк --- если написать что-то по-русски, а потом стереть, то на экране символ стирается целиком, а из буффера --- только 1 байт. И потом, нажав ENTER, получаешь ругань относительно синтаксиса или несущ. файла или еще чего. Я думаю, что виноват не только bash, но readline, которую он использует.

У 3-го, судя по постам, вроде проблем нет.
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Mon Jan 31, 2005 7:46 pm    Post subject: Reply with quote

viy wrote:
У 3-го, судя по постам, вроде проблем нет.


Ага, понял. Значит надо будет 3-ий поглядеть обязательно.
Из http://ru.gentoo-wiki.com/HOWTO_ru_RU.utf8_Gentoo_way я так понял, надо в USE добавить unicode, в ядре включить UTF-8 и пересобрать ncurses и slang? а readline в таком случае надо пересобирать или пересоберётся с ними?
_________________
wbr!
Back to top
View user's profile Send private message
viy
Veteran
Veteran


Joined: 03 Jul 2004
Posts: 1580
Location: Riga, Latvia

PostPosted: Mon Jan 31, 2005 8:27 pm    Post subject: Reply with quote

readline, как таковая, не имеет USE-флажков. Но мне кажется, что в поставку bash'а включена версия readline (не требует он ее, видно из ebuild'а). Так вот, в 3-ей ветке что-то основательно подправили.

Вообщем, делай все по howto и ставь 3-ий bash.
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Mon Jan 31, 2005 8:37 pm    Post subject: Reply with quote

Спасибо. Буду пробовать :wink:
_________________
wbr!
Back to top
View user's profile Send private message
devil_ua
Tux's lil' helper
Tux's lil' helper


Joined: 23 Jun 2004
Posts: 128
Location: Kiev, Ukraine

PostPosted: Tue Feb 01, 2005 8:41 pm    Post subject: Reply with quote

UTSL wrote:
centericq работает
emacs работает
irssi тоже работает

Если вас не затруднит можно дописать ховто на ru.gentoo-wiki.com
по поводу centericq.

--- Администрация ru.gentoo-wiki.com
_________________
Web developer & High-load application deployer
Web Site: http://simonov.me
E-Mail: alex@simonov.me
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Wed Feb 02, 2005 4:01 pm    Post subject: Reply with quote

а что для работы centericq с utf8 нужные какие-то особые телодвижения?
_________________
wbr!
Back to top
View user's profile Send private message
devil_ua
Tux's lil' helper
Tux's lil' helper


Joined: 23 Jun 2004
Posts: 128
Location: Kiev, Ukraine

PostPosted: Thu Feb 03, 2005 12:49 pm    Post subject: Reply with quote

danzz wrote:
а что для работы centericq с utf8 нужные какие-то особые телодвижения?

я незнаю, так как непользуюсь :)
_________________
Web developer & High-load application deployer
Web Site: http://simonov.me
E-Mail: alex@simonov.me
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Sun Feb 06, 2005 7:28 pm    Post subject: Reply with quote

Помогите разобраться :). Вот есть локаль ru_RU.UTF-8, с ней сообщения будут на русском, есть популярная всеми en_GB.UTF-8, а чем она так популярна? :)

У меня задача такая: к примеру в одной папке лежат файлы с русскиим символами в имени и часть файлов с немецкими (умлауты). Какую локаль мне использовать, чтобы и русские и немецкие символы отображались нормально?

Ссылки на какую-нибудь документацию или другие треды приветствуются.
_________________
wbr!
Back to top
View user's profile Send private message
lefsha
Veteran
Veteran


Joined: 30 Aug 2004
Posts: 1014
Location: Sankt-Petersburg, Russia

PostPosted: Fri Feb 11, 2005 4:14 am    Post subject: Reply with quote

danzz wrote:
Помогите разобраться :). Вот есть локаль ru_RU.UTF-8, с ней сообщения будут на русском

Какую локаль мне использовать, чтобы и русские и немецкие символы отображались нормально?


Сообщения будут на таком языке чему равна переменная
LC_MESSAGES.

Чтобы символы отображались нормально
нужен шрифт уникодный. В документации предлагают terminus. Вроде бы ничего.
_________________
Lefsha
Back to top
View user's profile Send private message
UTSL
n00b
n00b


Joined: 19 Jan 2005
Posts: 10

PostPosted: Mon Feb 14, 2005 8:58 am    Post subject: Reply with quote

devil_ua wrote:
UTSL wrote:
centericq работает
emacs работает
irssi тоже работает

Если вас не затруднит можно дописать ховто на ru.gentoo-wiki.com
по поводу centericq.

--- Администрация ru.gentoo-wiki.com

да там писать нечего просто кодировку поменять и всё.
_________________
Use The Source, Luke
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Tue Feb 15, 2005 3:07 pm    Post subject: Reply with quote

lefsha wrote:
danzz wrote:
Помогите разобраться :). Вот есть локаль ru_RU.UTF-8, с ней сообщения будут на русском

Какую локаль мне использовать, чтобы и русские и немецкие символы отображались нормально?


Сообщения будут на таком языке чему равна переменная
LC_MESSAGES.

Чтобы символы отображались нормально
нужен шрифт уникодный. В документации предлагают terminus. Вроде бы ничего.


Т.е. в utf8 изначально есть всякие символы разных языков? т.е. с utf8 я смогу в одной папке видеть имена файлов на немецком, русском, японском? а конкретная локаль нужна для отображения сообщений на нужном мне языке?
_________________
wbr!
Back to top
View user's profile Send private message
viy
Veteran
Veteran


Joined: 03 Jul 2004
Posts: 1580
Location: Riga, Latvia

PostPosted: Tue Feb 15, 2005 3:36 pm    Post subject: Reply with quote

utf8 --- это формат кодирования UNICODE символов. UNICODE --- это стандарт, использующий 4 байта для кодировки 1 glyph'а (визуального символа), позволяющий кодировать все сужествующие символы по единой схеме. (Про 4-байта --- объяснение на пальцах, если есть непонимаие/претензии, то надо смотреть тех. спецификации).

locale --- настраивает поведение системы. Конкретно определяет, каким образом должны говорить программы, показываться числа, валюты, время, системные сообщения, указывает правильный порядок символов при сортировке строк "больше-меньше".

Будет ли прога использовать то, что указано в локали --- зависит от того, умеет ли она это делать в принципе, а также были ли установлены файлы с сообщениями в соотв. языке (часто бывает, что прога поддерживает многоязычность, но перевести все на русский никто не удосужился).

Ну и чтобы все это ты увидел, у тебя должны быть "правильные" шрифты.
Back to top
View user's profile Send private message
lefsha
Veteran
Veteran


Joined: 30 Aug 2004
Posts: 1014
Location: Sankt-Petersburg, Russia

PostPosted: Fri Feb 18, 2005 10:11 pm    Post subject: Reply with quote

danzz wrote:

Т.е. в utf8 изначально есть всякие символы разных языков? т.е. с utf8 я смогу в одной папке видеть имена файлов на немецком, русском, японском? а конкретная локаль нужна для отображения сообщений на нужном мне языке?


Нет. UTF-8 это способ кодирования, который подразумевает возможность работы
с разными языками. Чтобы видеть эти символы на экране или печати необходимо иметь
файлы шрифтов, которые определяют какой именно значек и как должен рисоваться при наборе
или выборе некоего кода формата UTF-8. Данный файл может содержать символы только
одного языка например и тогда при всем желании отобразить символы других языков не удастся.
Однако информация о них будет как и прежде передаваться, но неправильно или вообще не
интерпретироваться. Так что при наличии полных шрифтов можно отображать одновременно
в одном документе символы всех включенных языков.
В этом как бы и смысл сего творения UTF-8.

Насчет локали, как таковая в случае UTF-8 она как бы теряет свой изначальный смысл.
Поэтому когда UTF-8 станет стандартом и люди забудут о других способах,
то ее должны отменить.
Сегодня смысл локали имеет, что что в ней проставлено UTF
и какое значения принимают отдельные переменные образующие эту
самую локаль. Как например LC_MESSAGES.

Лично же мое мнение, что все эти настройки сделаны в Линухе
очень криво. Они разбиты по разным файлам и директориям.
И вместо того чтобы просто присвоить какие-то значения
переменным приходится "колдовать".
Во всех этих планах Windows делает Linux как ребенка.
Есть правда надежда, что кто-то разродится проектом
линух окружение и тогда это начнет приобретать более
адекватный смысл и вид.
Пока же это все сплошные костыли.
_________________
Lefsha
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Sat Feb 19, 2005 5:28 am    Post subject: Reply with quote

2 lefsha, 2 viy: спасибо за "разжовывание", кое-что хорошо прояснилось :), ещё cyrillic-howto поглядел.
_________________
wbr!
Back to top
View user's profile Send private message
danzz
n00b
n00b


Joined: 14 Jan 2005
Posts: 23
Location: Kemerovo

PostPosted: Fri Apr 15, 2005 6:19 pm    Post subject: Reply with quote

Дошли руки до установки, наконец-то, но с UTF-8 получил некоторые проблемы в консоли.

Значит, у меня есть следующее:
USE="... nls ... unicode ..."

$ emerge -pv slang ncurses
[ebuild R ] sys-libs/ncurses-5.4-r6 -bootstrap -build -debug -doc +gpm -minimal -nocxx +unicode 2,103 kB
[ebuild R ] sys-libs/slang-1.4.9-r1 -cjk +unicode 616 kB

Для себя прописал в bash_profile локаль ru_RU.UTF-8.

$ locale
LANG=ru_RU.UTF-8
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=

Теперь конфиги:

/etc/rc.conf
... UNICODE="yes" ...

/etc/conf.d/consolefont
CONSOLEFONT="ter-c16f"

/etc/conf.d/kemaps
KEYMAP="-u ru4"
SET_WINDOWKEYS="yes"
DUMPKEYS_CHARSET="koi8-r"

Делаю от root-а
/etc/init.d/keymaps restart
/etc/init.d/consolefont restart
Логинюсь, locale показывает, что всё ок, date выводит сообщение на русском.

Запускаю centericq и вижу что-то типа: "~Bек~C~Iий кон~Bак~B".
Что это такое? откуда оно взялось?
_________________
wbr!
Back to top
View user's profile Send private message
outs
n00b
n00b


Joined: 01 May 2005
Posts: 23
Location: Russian Federation, Samara

PostPosted: Sun Nov 06, 2005 3:24 pm    Post subject: Reply with quote

хотелось бы разобраться с centericq
у меня аналогичная проблема
непонятные кракозябры при запуске

у кого-нибудь при настроенном юникоде рабоает centericq

если да, то какие телодвижения для этого вы принимали?

система переведена на юникод согласно официальному how-to...
Back to top
View user's profile Send private message
[clu]
Apprentice
Apprentice


Joined: 23 Feb 2004
Posts: 160
Location: 127.0.0.1

PostPosted: Mon Nov 07, 2005 8:56 am    Post subject: Reply with quote

а в mc диалоговые окна, у них всё нормально с границами? :)
Back to top
View user's profile Send private message
Balancer
Guru
Guru


Joined: 04 Jun 2004
Posts: 465

PostPosted: Mon Nov 07, 2005 9:06 am    Post subject: Reply with quote

Использую несколько (штук 5..6) машин на Gentoo, все в UTF-8. Проблем не могу вспомнить :)
Back to top
View user's profile Send private message
outs
n00b
n00b


Joined: 01 May 2005
Posts: 23
Location: Russian Federation, Samara

PostPosted: Mon Nov 07, 2005 11:36 am    Post subject: Reply with quote

я также пользую 5 машин на дженту на юникоде и проблемы есть везде
это centericq и elinks (при просмотре им локальных файлов и папок наблюдаются жуткие косяки при отображении даты их создания)

а остальные приложения (по крайней мере из моего набора) работают вроде ок
mc не использую, поэтому как там дела обстоят - я не знаю
Back to top
View user's profile Send private message
Balancer
Guru
Guru


Joined: 04 Jun 2004
Posts: 465

PostPosted: Mon Nov 07, 2005 1:25 pm    Post subject: Reply with quote

>это centericq и elinks

Ни того, ни другого не использую. Т.к. на десктопе у меня GUI, а на серверах мне centericq и elinks не нужны :)

>mc не использую, поэтому как там дела обстоят - я не знаю

Использую постоянно - всё ок. Только хелп не работает, да я его и не использую :)

...

А, да. На некоторых машинах проблемы с lynx'ом. Часть русских букв не отображается.
Back to top
View user's profile Send private message
lefsha
Veteran
Veteran


Joined: 30 Aug 2004
Posts: 1014
Location: Sankt-Petersburg, Russia

PostPosted: Wed Nov 09, 2005 4:58 pm    Post subject: Reply with quote

viy wrote:
danzz wrote:
Какие грабли с utf8 у bash?

У последнего из 2-ой ветки (у меня GNU bash, version 2.05b.0(1)-release) такой глюк --- если написать что-то по-русски, а потом стереть, то на экране символ стирается целиком, а из буффера --- только 1 байт. И потом, нажав ENTER, получаешь ругань относительно синтаксиса или несущ. файла или еще чего. Я думаю, что виноват не только bash, но readline, которую он использует.

У 3-го, судя по постам, вроде проблем нет.


Странно а у меня почему-то есть....

Вроде бы у второй больше проблем было.
3 работает, именно эта проблема имеет место быть.
_________________
Lefsha
Back to top
View user's profile Send private message
Display posts from previous:   
Reply to topic    Gentoo Forums Forum Index Russian All times are GMT
Goto page 1, 2  Next
Page 1 of 2

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum