[personal profile] dememax
ASCII Code Chart. Anomie, 29 August 2008

(Натолкнула на размышления вот эта строка из chrome/content/filterClasses.js проекта Adblock Plus. В POSIX API regcomp()/regexec() всё также работает, как и в JavaScript.)


Почему срабатывает следующее выражение?
> echo "a.b" | grep -E '[ -#]'
a.b
Ведь в ASCII и UTF-8 точка находится после диеза.
Поправить легко:
> echo "a.b" | LANG= grep -E '[ -#]'

Оказывается, это устойчивое поведение.
> touch 'a ' ; touch 'a!' ; touch 'a"' ; touch 'a#' ; touch 'a.' ; touch 'a,'
> ls
a   a,  a!  a.  a"  a#
> LANG= ls
a   a!  a"  a#  a,  a.


Братцы, как называется эта Collating sequence для этих знаков, отличная от ASCII/Unicode?

Update: http://www.collation-charts.org/ (Спасибо Яше!)

Date: 2010-10-25 02:09 pm (UTC)
From: [identity profile] itman.livejournal.com
Похоже, что collation tables зависят от текущей языковой установки. LANG= похоже экивалетно LANG=C и задает просто "естественный" ASCII порядок.

Date: 2010-11-02 11:43 am (UTC)
From: [identity profile] mansch.livejournal.com
пиши баг репорт!

Date: 2015-10-04 06:44 pm (UTC)
From: [identity profile] great-mahatma.livejournal.com
Ничего не понял, да и фиг с ним.

Profile

dememax

May 2023

S M T W T F S
 123456
78910111213
14151617181920
21 2223 24252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 3rd, 2026 06:50 pm
Powered by Dreamwidth Studios