메뉴 건너뛰기

GREATUSER

free

MySQL 8.0: ひらがなカタカナを判別する日本語用Collation 以前の記事では、MySQL 8.0.1で導入された新しい 日本語のutf8bm4のCollation(文字照合順)について ご紹介しました。このcollation (utf8mb4_ja_0900_as_cs) は、CLDR 30で定義されたアクセント記号(清音濁音半濁音)ならびに大文字小文字(拗音促音など)を判別する実装となっています。 今日ご紹介するのはひらがなカタカナを判別できる新しい「かなセンシティブ」なCollation utf8mb4_ja_0900_as_cs_ksです。DUCETではひらがながカタカナよりも前にソートされるように3次レベルの重みを定義しています。例えば: 3042 ; [.3D5A.0020.000E] # HIRAGANA LETTER A 30A2 ; [.3D5A.0020.0011] # KATAKANA LETTER A 2次レベルでの違い(000E および 0011)によって 0x3042 (あ) < 0x30A2 (ア) となります。CLDRではひらがなとカタカナの違いは4次レベル(例: &あ<<<<ア)で比較するよう定義されています。デフォルトの比較レベルは3次レベル(強さ 3)となっており、最初の3次レベルでみると同じとなります。 utf8mb4_ja_0900_as_cs_ksについて utf8mb4_ja_0900_as_csに対していただいたフィードバックにお応えする形で、ひらがなとカタカナを判別する新しいCollationである utf8mb4_ja_0900_as_cs_ks を追加することにしました。ここでの’_ks’は「かなセンシティブ Kana Sensitive」を意味しています。 このCollationは最初の3次レベルまでが同じひらがなとカタカナの判別に必要となる4次レベルでの処理を行います。以下の例では、utf8mb4_ja_0900_as_cs および utf8mb4_ja_0900_as_cs_ks のそれぞれのCollationでの文字列比較結果です: mysql> SET @s1 = CONVERT('きゅう' USING utf8mb4); Query OK, 0 rows affected (0.01 sec) mysql> SET @s2 = CONVERT('キュウ' USING utf8mb4); Query OK, 0 rows affected (0.00 sec) mysql> SET @s3 = CONVERT('きゆう' USING utf8mb4); Query OK, 0 rows affected (0.00 sec) mysql> SET @s4 = CONVERT('キユウ' USING utf8mb4); Query OK, 0 rows affected (0.00 sec) mysql> SELECT STRCMP(@s1 COLLATE utf8mb4_ja_0900_as_cs, @s2); +------------------------------------------------+ | STRCMP(@s1 COLLATE utf8mb4_ja_0900_as_cs, @s2) | +------------------------------------------------+ | 0 | +------------------------------------------------+ 1 row in set (0.00 sec) mysql> SELECT STRCMP(@s2 COLLATE utf8mb4_ja_0900_as_cs, @s3); +------------------------------------------------+ | STRCMP(@s2 COLLATE utf8mb4_ja_0900_as_cs, @s3) | [ more... ]

The post MySQL 8.0: ひらがなカタカナを判別する日本語用Collation appeared first on 지락문화예술공작단.




원문출처 : https://jirak.net/wp/mysql-8-0-%E3%81%B2%E3%82%89%E3%81%8C%E3%81%AA%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A%E3%82%92%E5%88%A4%E5%88%A5%E3%81%99%E3%82%8B%E6%97%A5%E6%9C%AC%E8%AA%9E%E7%94%A8collation/
번호 제목 글쓴이 날짜 조회 수
820 Microsoft releases additional updates to protect against potential nation-state activity 관리자 2017.06.14 338
819 AWS GovCloud 두번째 리전 2018년 출시 예고 관리자 2017.06.14 253
818 OneDrive Files On-Demand now available for Windows Insiders 관리자 2017.06.14 257
817 Debugging Character Set Issues by Example 관리자 2017.06.14 296
816 E3 2017: Alienware and Dell announce PC gaming systems powered by Windows 10 관리자 2017.06.13 317
815 Rate Limiting with NGINX and NGINX Plus 관리자 2017.06.13 348
814 E3 2017: A classic returns to Windows 10 in Age of Empires: Definitive Edition 관리자 2017.06.13 237
813 E3 2017: Everything you need to know about what Xbox shared at the PC Gaming Show 관리자 2017.06.13 318
812 E3 2017: ORIGIN PC announces thin and light EVO15-S laptop powered by Windows 10 관리자 2017.06.13 232
811 Windows 10 Tip: Browse books in the Windows Store with the Windows 10 Creators Update 관리자 2017.06.13 312
810 AWS 6월 온라인 세미나 – AWS 클라우드 소개, MSSQL 서버 운영, VPC 심층 분석 및 데브옵스를 위한 AWS CodeStar 활용 등 관리자 2017.06.13 275
809 AWS 주간 소식 모음 – 2017년 6월 12일 관리자 2017.06.12 291
808 Introducing more shopping tips with Cortana in Microsoft Edge 관리자 2017.06.10 235
807 Announcing Windows 10 Insider Preview Build 16215 for PC + Build 15222 for Mobile 관리자 2017.06.09 248
806 This Week on Windows: Beauty and the Beast, Yooka-Laylee and more 관리자 2017.06.09 68
위로