海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと。
そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。
A Field Guide to Japanese Mojibake
https://www.dampfkraft.com/mojibake-field-guide.html
マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。
文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。
(以下略、続きはソースでご確認下さい)
Gigazine 2021年11月02日 20時00分
https://gigazine.net/news/20211102-mojibake-field-guide-japanese/
探検
【話題】海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2021/11/03(水) 16:48:08.92ID:CAP_USER2名無しのひみつ
2021/11/03(水) 16:52:15.06ID:cNE+HCyZ 最近は文字化けっつうよか数式化けが多いと思う
3名無しのひみつ
2021/11/03(水) 16:56:30.26ID:hHr6BmXQ ノーベル賞まだあ
2021/11/03(水) 17:01:39.58ID:C306C8YZ
中国の漢字になってるのが
イライラする
イライラする
2021/11/03(水) 17:12:45.02ID:eY+P1d2u
html文がそのままブラウザに出ちゃったり
6名無しのひみつ
2021/11/03(水) 17:14:02.32ID:CQHOUvZ9 カタカナ、ひらがな 漢字 ローマ字 まだあるが、
こんなに多数の文字を使う日本語って、国際的には
一寸変では?
川端康成がそれが日本語の表現を支えると言っていたが
ノーベル文学賞はローマ字しかない、英米の方が圧倒的に多い。
そろそろ改革する天皇が現れないかな、
文字覚えというムダがなくなったら学問が進歩すると思う。
こんなに多数の文字を使う日本語って、国際的には
一寸変では?
川端康成がそれが日本語の表現を支えると言っていたが
ノーベル文学賞はローマ字しかない、英米の方が圧倒的に多い。
そろそろ改革する天皇が現れないかな、
文字覚えというムダがなくなったら学問が進歩すると思う。
2021/11/03(水) 17:20:16.72ID:9blDbnXJ
からだ、カラダ、体、體、karada、身体
微妙にニュアンスが違うような
微妙にニュアンスが違うような
8名無しのひみつ
2021/11/03(水) 17:25:16.39ID:QSCKD8rO 鬼詰のオ刃
9名無しのひみつ
2021/11/03(水) 17:26:03.56ID:bAxBuzZQ >>6
文字が少なくなれば、覚えなきゃいけない単語の数が増えるだけだろ
文字が少なくなれば、覚えなきゃいけない単語の数が増えるだけだろ
10名無しのひみつ
2021/11/03(水) 17:28:50.18ID:k/DoP7Rf11名無しのひみつ
2021/11/03(水) 17:36:40.33ID:+OaUiH3a12名無しのひみつ
2021/11/03(水) 17:36:52.45ID:z3jUw6Y3 ちょっと先は闇、とは言わんやろ
単なる変換の癖に依存するだけで多様性の問題とは無関係
単なる変換の癖に依存するだけで多様性の問題とは無関係
13名無しのひみつ
2021/11/03(水) 17:41:16.04ID:w3vrbqJu 帰国子女とか漢字苦手でバカっぽくて笑える。
14名無しのひみつ
2021/11/03(水) 17:46:11.07ID:upQmf2lo メーラーのサンダーバードが、先日のアップデート後文字化けするようになったなぁ…。
文字コードの指定ができなくなってて、アドオンいれないと駄目とかになってた。
監視装置からの自動メールで、文字コード指定をcontent-typeにしていない古いタイプだったのが原因なので、
まぁ古いししかたないんだろうけど、ないがしろにされてるな、と思ったもんです。
文字コードの指定ができなくなってて、アドオンいれないと駄目とかになってた。
監視装置からの自動メールで、文字コード指定をcontent-typeにしていない古いタイプだったのが原因なので、
まぁ古いししかたないんだろうけど、ないがしろにされてるな、と思ったもんです。
15名無しのひみつ
2021/11/03(水) 17:47:31.54ID:kKfhuMVG 役所からダウンロードした書類様式が中華フォントな事がちょいちょいあって苛つく
16名無しのひみつ
2021/11/03(水) 17:57:22.01ID:k/DoP7Rf17名無しのひみつ
2021/11/03(水) 17:59:48.18ID:bT2k+NG9 >文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと
いや、そこはみんな知ってると思う
いや、そこはみんな知ってると思う
18名無しのひみつ
2021/11/03(水) 18:01:39.38ID:upQmf2lo19名無しのひみつ
2021/11/03(水) 18:03:02.54ID:jEKZk2mT そもそも「寸」は尺貫法の廃止で使うべきではない単位
現代風に言うと「1ミリも」となるべきで、それこそ多様性というべきだが、
「ちょっと」が「1ミリ」と変換されない時点で多様性と呼べるような多様性は存在しない
現代風に言うと「1ミリも」となるべきで、それこそ多様性というべきだが、
「ちょっと」が「1ミリ」と変換されない時点で多様性と呼べるような多様性は存在しない
20名無しのひみつ
2021/11/03(水) 18:03:24.71ID:hplrk7sf >>6
天皇になんかそんな難しいことできるわけがない
今の日本語の体系をいったん完全にぶっ壊さないと。
できるのは政界の「壊し屋」小沢一郎(東北比例復活)と
NHKをぶっ壊そうとしてる立花氏しかいないね。
天皇になんかそんな難しいことできるわけがない
今の日本語の体系をいったん完全にぶっ壊さないと。
できるのは政界の「壊し屋」小沢一郎(東北比例復活)と
NHKをぶっ壊そうとしてる立花氏しかいないね。
21名無しのひみつ
2021/11/03(水) 18:04:09.01ID:ULo8UpUQ22名無しのひみつ
2021/11/03(水) 18:09:34.57ID:1Hw779fh 最近は勝手に中国漢字のフォントに置き換わるのがイライラ。
23名無しのひみつ
2021/11/03(水) 18:10:31.85ID:k/DoP7Rf >>19
>>現代風に言うと「1ミリも」となるべきで、それこそ多様性というべきだが、
すでにこの表現は登場している。
定着はしていないだけで。
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14136076384
>>現代風に言うと「1ミリも」となるべきで、それこそ多様性というべきだが、
すでにこの表現は登場している。
定着はしていないだけで。
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14136076384
24名無しのひみつ
2021/11/03(水) 18:12:20.30ID:k/DoP7Rf25名無しのひみつ
2021/11/03(水) 18:13:13.20ID:pj3fdFiA CADデータやり取りするとしょっちゅう有る
26名無しのひみつ
2021/11/03(水) 18:14:10.54ID:CQHOUvZ9 志賀直哉は終戦後に日本語廃止してフランス語にしようと
言った記録がある。
言った記録がある。
28名無しのひみつ
2021/11/03(水) 18:15:28.70ID:upQmf2lo >>19
なぁ、「ミリ」って何だと思う?
ミリグラム?ミリメートル?ミリリットル?それともミリシーベルト?
千分の一って意味しか無いんだよ、単位の接頭辞だから。
単位についてうるさく言うくせに、分かってないんじゃねーの。
とはいえ、「ちょっと」って意味で使うには向いてるってことではあるけどね。
日本語で言うなら「一毛もない」って言葉と一致する。毛は千分の一だからね。
「一毫もない」でも良いらしいけども。毛と毫は一緒。
なぁ、「ミリ」って何だと思う?
ミリグラム?ミリメートル?ミリリットル?それともミリシーベルト?
千分の一って意味しか無いんだよ、単位の接頭辞だから。
単位についてうるさく言うくせに、分かってないんじゃねーの。
とはいえ、「ちょっと」って意味で使うには向いてるってことではあるけどね。
日本語で言うなら「一毛もない」って言葉と一致する。毛は千分の一だからね。
「一毫もない」でも良いらしいけども。毛と毫は一緒。
29名無しのひみつ
2021/11/03(水) 18:16:06.03ID:zRYflEG3 「裏世界ピクニック」が出てるあたり....
30名無しのひみつ
2021/11/03(水) 18:16:25.41ID:k/DoP7Rf31名無しのひみつ
2021/11/03(水) 18:18:27.83ID:b/ONh8Zr ウリナラにはハングル一文字しかないニダ (⌒∇⌒)
32名無しのひみつ
2021/11/03(水) 18:19:06.92ID:upQmf2lo >>19
「海底二万マイル」という本のタイトルを
「海底32186.88キロメートル」にしたら味気ないだろ…。
言葉と単位は別なんだよね。取引に使うことは禁じられてるが文学的表現が禁止されることはない。
ところで海底二万哩のマイルは海里だろうか。
だとしたら「海底37040キロメートル」が正しいタイトルになるが・・・
「海底二万マイル」という本のタイトルを
「海底32186.88キロメートル」にしたら味気ないだろ…。
言葉と単位は別なんだよね。取引に使うことは禁じられてるが文学的表現が禁止されることはない。
ところで海底二万哩のマイルは海里だろうか。
だとしたら「海底37040キロメートル」が正しいタイトルになるが・・・
33名無しのひみつ
2021/11/03(水) 18:20:56.40ID:Bzfvj97w >>32
地球の裏側に出てしまうw
地球の裏側に出てしまうw
35名無しのひみつ
2021/11/03(水) 18:27:12.24ID:Kfv+aTXJ >>1
シコタホア!
シコタホア!
36名無しのひみつ
2021/11/03(水) 18:27:37.01ID:RNU2X+0F ハングルって長方形に文字化けするよね?
37名無しのひみつ
2021/11/03(水) 18:29:40.62ID:uH20BhG/ いや、普通の話だろ
コードが違うんだから
馬鹿なのか?
コードが違うんだから
馬鹿なのか?
38名無しのひみつ
2021/11/03(水) 18:34:40.57ID:H01kX1Ne >>6
それは絶対にやってはいけないしやらない
韓国人はバカで歴史が無いから漢字を廃止したが漢字廃止の弊害に悩まされて最近復活させた
おまえも韓国人同様バカだからデメリットに全く思いが及ばないわけだw
情けないやつw
それは絶対にやってはいけないしやらない
韓国人はバカで歴史が無いから漢字を廃止したが漢字廃止の弊害に悩まされて最近復活させた
おまえも韓国人同様バカだからデメリットに全く思いが及ばないわけだw
情けないやつw
39名無しのひみつ
2021/11/03(水) 18:37:53.35ID:H01kX1Ne >>20
アホか。小沢なんて無学だし立花はさらに無学
どうしてできると思うのかアホ丸出し
天皇には背後に膨大なブレーンが控えてるから号令かければできる
憲法が縛りをかけてるから現実には表立ってはできないがな
アホか。小沢なんて無学だし立花はさらに無学
どうしてできると思うのかアホ丸出し
天皇には背後に膨大なブレーンが控えてるから号令かければできる
憲法が縛りをかけてるから現実には表立ってはできないがな
41名無しのひみつ
2021/11/03(水) 18:40:30.16ID:T5xzoaLM42名無しのひみつ
2021/11/03(水) 18:50:38.28ID:7cuKq/6y 慣れると分かるようになるのか
すげーなw
すげーなw
44名無しのひみつ
2021/11/03(水) 19:00:42.86ID:7c7mfE4n 文字化けの縺って高確率で入ってるの見るたびなんか面白い
45名無しのひみつ
2021/11/03(水) 19:03:47.75ID:qlOnfLcF 5chとかコソアンとかの文字化けは昔はコード変えれば読み書きできたが今は通用しないのが多い
46名無しのひみつ
2021/11/03(水) 19:04:24.56ID:qlOnfLcF まあ文字化けはエンジニアの領域だから国籍はあまり関係ないと思
47名無しのひみつ
2021/11/03(水) 19:09:57.99ID:wPcZYjV1 決めた。
卒論の研究テーマ。
卒論の研究テーマ。
48名無しのひみつ
2021/11/03(水) 19:11:12.49ID:N41ksp9B49名無しのひみつ
2021/11/03(水) 19:25:40.98ID:N41ksp9B 「縺」「繧」「繝」「縲」
糸偏四天王
糸偏四天王
50名無しのひみつ
2021/11/03(水) 19:40:31.74ID:K4jy1wLL インターネット老人会のわしに言わせれば
UTF8のお陰でだいぶ文字化け問題は解決されたもんじゃよ
異体字とか微妙な問題は残ってるが25年前の文字化け地獄と比べたら天国じゃ
UTF8のお陰でだいぶ文字化け問題は解決されたもんじゃよ
異体字とか微妙な問題は残ってるが25年前の文字化け地獄と比べたら天国じゃ
51名無しのひみつ
2021/11/03(水) 19:44:35.16ID:wqWYCqAC 通だね通だね通だね
52名無しのひみつ
2021/11/03(水) 19:49:50.53ID:z+3LxhVs >>1
どこら辺に日本通っぷりが披露されてるのか掠ってもいなくてソースへ誘導されても・・・
どこら辺に日本通っぷりが披露されてるのか掠ってもいなくてソースへ誘導されても・・・
53名無しのひみつ
2021/11/03(水) 19:59:31.41ID:KnIpm/jz モウジベーク
54名無しのひみつ
2021/11/03(水) 20:24:55.36ID:kxrwzi0H 異体字が同じコードだったり別のコードだったりして、てのが解けない問題なのかな。
55名無しのひみつ
2021/11/03(水) 20:25:03.86ID:nWQFMxw2 SMSのPDU解読は大変やった。
最近は良くなったけど。
最近は良くなったけど。
56名無しのひみつ
2021/11/03(水) 20:42:40.17ID:9ruwuoZS >>33
いいセンスだね。
いいセンスだね。
57名無しのひみつ
2021/11/03(水) 20:51:30.14ID:PZntKU/p 具志堅用高
58名無しのひみつ
2021/11/03(水) 20:52:47.43ID:KAPRIQbD linuxとか使ってると日本語環境でもいまだに文字化けするからな
何度改善されてもアップグレードされるとアルファベットの事しか考慮されない仕様に巻き戻る
''$'\343\203\200\343\202\246\343\203\263\343\203\255\343\203\274\343\203\211'
''$'\343\203\206\343\203\263\343\203\227\343\203\254\343\203\274\343\203\210'
''$'\343\203\207\343\202\271\343\202\257\343\203\210\343\203\203\343\203\227'
''$'\343\203\211\343\202\255\343\203\245\343\203\241\343\203\263\343\203\210'
''$'\343\203\223\343\203\207\343\202\252'
''$'\343\203\224\343\202\257\343\203\201\343\203\243'
''$'\343\203\237\343\203\245\343\203\274\343\202\270\343\203\203\343\202\257'
''$'\345\205\254\351\226\213'
何度改善されてもアップグレードされるとアルファベットの事しか考慮されない仕様に巻き戻る
''$'\343\203\200\343\202\246\343\203\263\343\203\255\343\203\274\343\203\211'
''$'\343\203\206\343\203\263\343\203\227\343\203\254\343\203\274\343\203\210'
''$'\343\203\207\343\202\271\343\202\257\343\203\210\343\203\203\343\203\227'
''$'\343\203\211\343\202\255\343\203\245\343\203\241\343\203\263\343\203\210'
''$'\343\203\223\343\203\207\343\202\252'
''$'\343\203\224\343\202\257\343\203\201\343\203\243'
''$'\343\203\237\343\203\245\343\203\274\343\202\270\343\203\203\343\202\257'
''$'\345\205\254\351\226\213'
59あ
2021/11/03(水) 20:59:57.36ID:ft1Qqcbj アラビア文字のキーボードってどんなんだろう
60名無しのひみつ
2021/11/03(水) 21:11:18.38ID:nWQFMxw2 アラビア語はアルファベットと同じでしょうね。
ただ母音のaが色々変化するって言うか表記が難しい?
コーラン見ると母音についた点とかで区別するらしいけどあまりよく知らない。
アラビア文字は昔、少しかじったけどだいぶ忘れたな。
右から左に読むアルフベットと同じ。
ただ母音のaが色々変化するって言うか表記が難しい?
コーラン見ると母音についた点とかで区別するらしいけどあまりよく知らない。
アラビア文字は昔、少しかじったけどだいぶ忘れたな。
右から左に読むアルフベットと同じ。
61名無しのひみつ
2021/11/03(水) 21:35:51.43ID:uk0Q0pfb 💩💩💩💩
…
…
文字に化けるかな?
…
…
文字に化けるかな?
63名無しのひみつ
2021/11/03(水) 22:27:36.66ID:mpE1tlDr64名無しのひみつ
2021/11/03(水) 22:37:43.17ID:E3KwSbkv 似てるからって中国の文字当てはめたのは狂ってると思ったよ
英語の文中でBがキリル文字のБになってたらどう思うんよ
英語の文中でBがキリル文字のБになってたらどう思うんよ
65名無しのひみつ
2021/11/03(水) 22:39:00.38ID:VqLym+x/66名無しのひみつ
2021/11/03(水) 22:39:10.58ID:mpE1tlDr >>7
それまでにこれらの語が使用された文章を多数読んでいた場合にニュアンスの微妙な差を自分なりに解釈する事が出来る
筆者の意図とは合致しないかも知れないがw
音韻は全て同じ(“ら”にrを用いるべきでは無い事はここでは置いとき)とすれば、これはあくまでも視覚の問題
そこから平仮名のなまめかしさの理由も浮かんで来る
等々面白いですこの辺
それまでにこれらの語が使用された文章を多数読んでいた場合にニュアンスの微妙な差を自分なりに解釈する事が出来る
筆者の意図とは合致しないかも知れないがw
音韻は全て同じ(“ら”にrを用いるべきでは無い事はここでは置いとき)とすれば、これはあくまでも視覚の問題
そこから平仮名のなまめかしさの理由も浮かんで来る
等々面白いですこの辺
67名無しのひみつ
2021/11/03(水) 22:42:30.81ID:mpE1tlDr68名無しのひみつ
2021/11/03(水) 22:52:02.82ID:IBDCuNEh69名無しのひみつ
2021/11/03(水) 23:09:37.46ID:bEMH6lQP :e enc=なんて今でも打たせるな。
日本語打てないOSなんていらん。JASTSYSTEMがちゃんとOS作れ。
日本語打てないOSなんていらん。JASTSYSTEMがちゃんとOS作れ。
70名無しのひみつ
2021/11/03(水) 23:14:09.12ID:yceTlpFu72名無しのひみつ
2021/11/03(水) 23:50:46.76ID:e6DXZVTx アルファベットのフォントって26文字作れば完成なんだよね
それに比べたて日本語…
それに比べたて日本語…
73名無しのひみつ
2021/11/04(木) 00:14:07.38ID:wLYv8z54 文字列を扱うプログラムを学び始めたとき
文字コードが分からないテキストは
全部の文字コードでエンコードデコードして元通りになった文字コードが正解というやり方を聞いて全然スマートじゃないと思った・・
文字コードが分からないテキストは
全部の文字コードでエンコードデコードして元通りになった文字コードが正解というやり方を聞いて全然スマートじゃないと思った・・
74名無しのひみつ
2021/11/04(木) 07:54:19.84ID:Sns9SlFH 一寸法師をちょっと法師とは言わんやろ
むしろ1ミリ法師の方が今の人間にはイメージしやすい
言葉は時代ととともに変わっていくのが本来で、アップデートできずに古い表現に固執する感性こそ問題視されるべき
むしろ1ミリ法師の方が今の人間にはイメージしやすい
言葉は時代ととともに変わっていくのが本来で、アップデートできずに古い表現に固執する感性こそ問題視されるべき
75名無しのひみつ
2021/11/04(木) 08:53:38.34ID:YczGDpsx 左道
77名無しのひみつ
2021/11/04(木) 08:55:58.68ID:IUu/xYCm IE 使用時はたまにあったな
79名無しのひみつ
2021/11/04(木) 09:21:36.18ID:8WFS1Pj/姦酷語ってボキャが絶対的に少ねーから、
コンセプチャル・ワークや文芸表現が不得手なんだよなー。
.
だから劣等バカチョンは、思考を通わせたり掘り下げて考えることができねーばかりか、
「唸らせるような感想」すら書けない。
.
しかもハングルには受身形がないんだぜ(苦笑)
受身形がないとどうなるか?
相手にどう思われるかを「考えないで」好き勝手に発言する。
そんな文字通りのバカ丸出しチョンな相手と話が通じあえる訳がねーわw
おまけに表音文字だけでしか表記しないので、文意を捉えることすら難解www
.
ここまでまぬけな劣等言語って、OECD諸国じゃ姦酷だけだろー
↓こんな感じになっちまうんだぜw
カンコク ゴ ッテ ボキャ ガ ゼッタイ テキ ニ スクネー カラ、
.
コンセプチャル ・ ワーク ヤ ブンゲイ ヒョウゲン ガ フエテ ナンダヨ ナー。
ダカラ レットウ バカチョン ハ 、
.
シコウ ヲ カヨワセ タリ ホリ サゲテ カンガエル コト ガ デキネー バカリ カ 、
.
「 ウナラセル ヨウ ナ カンソウ 」 スラ カケ ナイ。
シカモ ハングル ニ ハ ウケミケイ ガ ナイ ン ダ ゼ。
.
ウケミケイ ガ ナイ ト ドウナルカ?
.
アイテ ニ ドウ オモワレ テル カ ヲ 「 カンガエ ナイ デ 」 スキカッテ ニ ハツゲン スル。
ソンナ モジ ドオリ ノ バカ マルダシ チョン ナ アイテ ト ハナシ ガ ツウジ アエル ワケ ガ ネー ワw
.
シカモ ヒョウオン モジ ノ ハングル ヒョウキ ナノデ 、ブンイ ヲ トラエル コト スラ ナンカイwww
.
ココマデ マヌケ ナ レットウ ゲンゴ ッテ 、 OECD ショコク ジャ カンコク ダケ ダロー
80名無しのひみつ
2021/11/04(木) 09:29:13.37ID:tewQPXFA 全ての文字を、1文字につき固定長4バイトで表すようにすれば、
物事は簡単になる。可変長コードとか、コード切り替え方式による
文字や文字列の処理はコードの複雑さやバグの温床になる。
OSもライブラリもアプリケーションも文字を固定長4バイトにすべきである。
どうしても容量が気になるところ、通信やファイルへの保存のところでは
やりたければ圧縮をかければ良いだけ。計算機の速度やメモリの容量が
倍々ゲームで増加してきたのだから、文字のデータサイズが4倍になった
としても、それは1度限りのことだから気にしなくても良いはずだ。
物事は簡単になる。可変長コードとか、コード切り替え方式による
文字や文字列の処理はコードの複雑さやバグの温床になる。
OSもライブラリもアプリケーションも文字を固定長4バイトにすべきである。
どうしても容量が気になるところ、通信やファイルへの保存のところでは
やりたければ圧縮をかければ良いだけ。計算機の速度やメモリの容量が
倍々ゲームで増加してきたのだから、文字のデータサイズが4倍になった
としても、それは1度限りのことだから気にしなくても良いはずだ。
81名無しのひみつ
2021/11/04(木) 09:44:42.05ID:4PAZQbAY ファイルは共通言語的なもので作成しておいて読む人が自国言語に変換するのがいいんじゃね
83名無しのひみつ
2021/11/04(木) 22:24:11.96ID:fnV6/3mm84名無しのひみつ
2021/11/04(木) 23:22:06.97ID:k/FFGpYA >>74
一寸は3cmだけどなあ
一寸は3cmだけどなあ
85名無しのひみつ
2021/11/05(金) 07:20:44.11ID:c9VlIvV8 ちょっとの虫にも五分の魂とは言わんやろ
調べたら一寸は30ミリくらいだから3cmの昆虫の五分=1.5cmで体長の半分が魂とか何訳の分からんこと言うてんのや
「ちょっと変」は3cmだけ変なのか?
おかしいやろ、そんなん
調べたら一寸は30ミリくらいだから3cmの昆虫の五分=1.5cmで体長の半分が魂とか何訳の分からんこと言うてんのや
「ちょっと変」は3cmだけ変なのか?
おかしいやろ、そんなん
86名無しのひみつ
2021/11/05(金) 07:55:14.60ID:gwgCfVeX >>58
ubuntuだとどうもwindowsと同じコードになってるっぽい
そんなことより愛知県で猫に似た茶色い謎の生物が目撃されているようだ
顎が尖っていて猫ではなさそうだが、犬を威嚇したりしているという
ubuntuだとどうもwindowsと同じコードになってるっぽい
そんなことより愛知県で猫に似た茶色い謎の生物が目撃されているようだ
顎が尖っていて猫ではなさそうだが、犬を威嚇したりしているという
87名無しのひみつ
2021/11/05(金) 07:59:17.84ID:gwgCfVeX88名無しのひみつ
2021/11/05(金) 08:02:30.56ID:gKRol2mO 文字コード統一しろよ
89名無しのひみつ
2021/11/05(金) 08:31:03.50ID:tuxp880h 文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。
この世で最も要らないスキル
この世で最も要らないスキル
92名無しのひみつ
2021/11/05(金) 12:20:57.76ID:oOcipLlk 一寸ていう単語だけで議論になるとかお前ら外国人かなんかか
93名無しのひみつ
2021/11/05(金) 13:32:39.98ID:rBTcdgil >>92
おかしいのは1人だけ。一寸をちょっとと読む「こともある」と理解できない、言語に「尺貫法はだめ」と主張するやつな。
おかしいのは1人だけ。一寸をちょっとと読む「こともある」と理解できない、言語に「尺貫法はだめ」と主張するやつな。
94名無しのひみつ
2021/11/05(金) 13:36:58.95ID:rBTcdgil >>85
を読めばわかるがものの例えを理解できないやつな。
を読めばわかるがものの例えを理解できないやつな。
95名無しのひみつ
2021/11/05(金) 19:50:39.50ID:S5mmaNwQ Linux環境でのzipファイルの展開なんて普通にやると確実に文字化ける
unar -e shift_jis ./files.zip
みたいに毎度コマンド打たなきゃならない
最近作られたファイルですらシフトジス指定で展開せにゃならんてなんなんよな
圧縮する時にwindows側で自動的にシフトジスが使われるんだろうけど
unar -e shift_jis ./files.zip
みたいに毎度コマンド打たなきゃならない
最近作られたファイルですらシフトジス指定で展開せにゃならんてなんなんよな
圧縮する時にwindows側で自動的にシフトジスが使われるんだろうけど
96名無しのひみつ
2021/11/05(金) 23:35:38.81ID:teZBz11U だいたいsjisが悪い
97名無しのひみつ
2021/11/06(土) 01:46:10.72ID:O+Rnz2Tb >>6
これアルファベットが26文字しかないから効率的っていうけど
真逆なんだよな
人間は生得的に文字を認識する脳内回路があるわけてはなく
他者の顔を認識する相貌認識の脳内回路を流用して文字を認識してる
進化の過程で他社の顔を見分けられないと死ぬので相貌認識は発達しててほぼ無尽蔵に他人の顔を覚えられるのが人間
だからたった26文字しか使ってない英語圏のほうがリソースを効率的に使ってないという事も言えるわけだ
実際は綴りとかの問題もあるし、一概に言えないし、そもそも一長一短があるから優劣と言うものも決められないわけだがね
これアルファベットが26文字しかないから効率的っていうけど
真逆なんだよな
人間は生得的に文字を認識する脳内回路があるわけてはなく
他者の顔を認識する相貌認識の脳内回路を流用して文字を認識してる
進化の過程で他社の顔を見分けられないと死ぬので相貌認識は発達しててほぼ無尽蔵に他人の顔を覚えられるのが人間
だからたった26文字しか使ってない英語圏のほうがリソースを効率的に使ってないという事も言えるわけだ
実際は綴りとかの問題もあるし、一概に言えないし、そもそも一長一短があるから優劣と言うものも決められないわけだがね
98名無しのひみつ
2021/11/06(土) 22:08:53.76ID:hl05XkDo FireFoxなどのブラウザで、URLを入力する欄で、URLに日本語が入って
表示されているとき、それをマウスを使ってテキストファイルにカットアンド
ペーストをすると、ブラウザで表示されていたのとはまるで違うぐちゃぐちゃの
わけの分からない文字列になってしまうので、とても不便だ。
あれは一体どうなっているのだろうか?
たとえば、以下のようにURLが表示されたりあるいは入力できるのに、
ja.wikipedia.org/wiki/日本
その文字列をコピーアンドペーストでメモ帳などに展開すると
以下のようになる。
ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC
わけがわからん。
表示されているとき、それをマウスを使ってテキストファイルにカットアンド
ペーストをすると、ブラウザで表示されていたのとはまるで違うぐちゃぐちゃの
わけの分からない文字列になってしまうので、とても不便だ。
あれは一体どうなっているのだろうか?
たとえば、以下のようにURLが表示されたりあるいは入力できるのに、
ja.wikipedia.org/wiki/日本
その文字列をコピーアンドペーストでメモ帳などに展開すると
以下のようになる。
ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC
わけがわからん。
99名無しのひみつ
2021/11/07(日) 01:03:16.67ID:esI7FX31 いまどきエスケープコードを8ビットにしてるからおかしなことになるのさ
文字エンコードの違いを理解出来ないバカなプログラマーを全員クビにするのもいいかも
文字エンコードの違いを理解出来ないバカなプログラマーを全員クビにするのもいいかも
100名無しのひみつ
2021/11/07(日) 04:40:43.03ID:26DC9H4l >97
認識の区切りはおそらく可変長
認識の区切りはおそらく可変長
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国が日本に対し輸出規制強化 レアアース含む軍民両用品 “高市発言”への対抗措置 ★4 [首都圏の虎★]
- 中国が日本に対し輸出規制強化 レアアース含む軍民両用品 “高市発言”への対抗措置 ★5 [首都圏の虎★]
- 原子力規制庁の職員が中国・上海で業務用スマホ紛失 国の個人情報保護委員会に報告 [ぐれ★]
- 万年筆が「2万2000円→4万4000円」に セーラー万年筆が大幅値上げ、他社も足並みそろえる [煮卵★]
- スマイリーキクチ 高校暴力動画の拡散に警鐘「私刑は〝正義〟ではなく〝制裁〟、加害者側です」 [少考さん★]
- 高市首相「日本の底力信じる」 昭和100年に触れ [少考さん★]
- 小野田紀美大臣って、女にしとくのはもったいないイケメソよな。高校時代クラスの女子食ってそう…… [875588627]
- 【高市終焉】中国、日本へのレアアース輸出制限か。禁輸リストにレアアースも含まれる★5 [931948549]
- 未解決事件File.09🏡世田谷一家殺害事件🈖🈑🈞
- 日本株配当利回り、長期金利下回る、17年半ぶり逆転、株高による配当利回りの低下と金利上昇が同時に進み、逆転が生じた [943688309]
- 【動画】島根のヤンキー、ガチでヤバいwwwwwwwwwwwwww [242521385]
- お笑い芸人ほんこん「国際法違反はダメですが、ベネズエラ国民はアメリカ大統領に感謝している」 [834922174]
