【IT】「メモ帳」がLinuxの改行コードをサポート

**ノチラ ★** · 2018/05/09(水) 23:51:08.97

　Microsoftの開発者向けイベント“Build 2018”が米国シアトルにて開催中で、今日は2日目のキーノートセッションが行われていました。新しい機械学習技術やクロスデバイス体験などがお披露目されましたが、なかでも会場を沸かせたのがこれ。
https://forest.watch.impress.co.jp/img/wf/docs/1120/764/image1_s.jpg

　なんと「メモ帳」が改行コード“LF（0x0A）”をサポートするのだそうです。Linuxなどで作成されたテキストファイルを「メモ帳」で開くと改行が認識されず、すべて一行で表示されてしまったりしますが、こうした不便が解消されます。

改行コードというのは、テキストの“改行”を表す特殊な文字（制御文字）のこと。一般的に“キャリッジリターン（CR：0x0D）”と“ラインフィード（LF：0x0A）”の2つをいい、もともとはタイプライターで紙を移動させる装置（キャリッジ）を元に戻す（リターン）操作と、紙を一行（ライン）だけ上に送る（フィード）操作を表しているのだそうです。

　どの制御文字を改行コードとして採用するかは歴史的な事情でプラットフォームごとに異なります。

Windows（CR＋LF）：CRとLFの2文字で改行を表す
Linux（LF）：LFのみで改行を表す
古いMac（CR）：CRのみで改行を表す
　“行を改めて行頭へカーソルを移動させる”操作を考えるとキャリッジリターンしてラインフィードする“CR＋LF”が本来の意味に忠実な気がしますが、それだけのために2文字も使うのは馬鹿らしいという考えにも一理あると思います（現在ではあまり気になりませんが、かつてはメモリもディスクもネットワークも今よりずっと貴重でした）。

　さて、「メモ帳」の改善については公式ブログ“Windows Command Line Tools For Developers”で詳しく説明されていますが、それによると

最新の「Windows 10 Insider Preview」で試せる（編集部にてBuild 17661で確認）
新規作成ファイルは従来通りCR+LFコードで作成される
LFだけでなくCRもサポートする
ステータスバーに改行コードの種類を表示する
互換性に問題がある場合はレジストリを編集して元の挙動に戻せるようにする
のだそうです。Linuxで開発されたソフトのライセンスや利用許諾、設定ファイルはLFコードで書かれていることが多いですが、わざわざサードパーティ製のテキストエディターをダウンロードしなくても「メモ帳」で閲覧・印刷できるようになるのは結構うれしいですね。
https://forest.watch.impress.co.jp/docs/serial/yajiuma/1120764.html

**名刺は切らしておりまして** · 2018/05/10(木) 07:31:39.83

>>92
ﾊﾟｲｿﾝはちょっとしたものを作るのに優れてるけど、大規模開発に耐えられるかなぁ～？

**名刺は切らしておりまして** · 2018/05/10(木) 07:44:19.61

>>101
できないことはないけど、基本はグルーだね

**名刺は切らしておりまして** · 2018/05/10(木) 07:52:18.84

>>62
BOM付けないと、エンコーディング指定できないメモ帳では何の文字コードで表示すればいいか分からんだろ

**名刺は切らしておりまして** · 2018/05/10(木) 08:14:34.20

>>20
無知を棚にあげて言い逃れかよ

**名刺は切らしておりまして** · 2018/05/10(木) 08:16:05.08

>>87
ん？、ビジネスニュースだろ

**名刺は切らしておりまして** · 2018/05/10(木) 08:28:29.38

Excelが、UTF-8のCSVを読み込めないというバカなんだけど。

**名刺は切らしておりまして** · 2018/05/10(木) 08:34:18.01

>>101
そもそも大規模って何作るのさ
いくつかの小さなPythonコードと、
大規模データベースと、HTMLのUI繋げりゃ
大抵の用途はカバーできると思うが

**名刺は切らしておりまして** · 2018/05/10(木) 08:38:57.69

>>107
大規模開発やったことないの？
自分はそこまで本格的な小規模開発やったことないけど。

**名刺は切らしておりまして** · 2018/05/10(木) 08:50:10.21

>>2
異なる改行コードが混在してたらどう表示して保存時にどうすればいいのかとか
CRLFじゃなくてLFCRだったら１つの改行にするのか２つの改行にするのかとか
イレギュラーなケースを考え始めると面倒くさくなって
まいっかで放置する気持ちはわかる

**名刺は切らしておりまして** · 2018/05/10(木) 08:53:31.42

>>2
この皮肉がわからない奴は
外であまり喋らない方がいい

**名刺は切らしておりまして** · 2018/05/10(木) 08:54:12.92

新しいMacはどうなんだよ？

**名刺は切らしておりまして** · 2018/05/10(木) 08:58:25.04

まじリナックス化し始めたw

**名刺は切らしておりまして** · 2018/05/10(木) 09:05:33.47

メモ帳は良く使う
ワードパッドは全く使わない
ワードパッドって残す意味あるの？

**名刺は切らしておりまして** · 2018/05/10(木) 10:31:45.31

今さら痔瘻

**名刺は切らしておりまして** · 2018/05/10(木) 11:03:32.50

>>44
どういう意味？

**名刺は切らしておりまして** · 2018/05/10(木) 11:09:04.75

メモ帳の対応より先にテキストファイルの改行コードすら統一出来てない方を問題視しろよ

**名刺は切らしておりまして** · 2018/05/10(木) 11:22:13.68

>>116
確かに
UTF-8のRFCあたりで改行コードの推奨があっても良かったかも

**名刺は切らしておりまして** · 2018/05/10(木) 12:12:11.91

素晴らしい。
欲をいえば、標準でvi使えませんかね。

**名刺は切らしておりまして** · 2018/05/10(木) 12:40:03.61

>>118
WSLを有効にしてください

**名刺は切らしておりまして** · 2018/05/10(木) 12:58:40.51

>>113
Rtf開くのにいるんじゃね

**名刺は切らしておりまして** · 2018/05/10(木) 13:00:28.53

>>62
まあいい加減Linux側もBOM読み飛ばすようにしろよって思う
どっちもどっちだわ

**名刺は切らしておりまして** · 2018/05/10(木) 13:12:12.27

この豆腐みたいのはなんですか？

**名刺は切らしておりまして** · 2018/05/10(木) 13:37:34.16

要するに、ソフトのインストールが制限される派遣とかには朗報って事?

**名刺は切らしておりまして** · 2018/05/10(木) 14:00:48.18

在日韓国・朝鮮人は単なる「不法入国犯罪者」です。

戦後の混乱で強制送還できず、しかたなく「朝鮮戦争の難民」という扱いで
特別に在留を法的に許可してる状態です。

つまり、朝鮮戦争が終結すると祖国へ帰らなければならないのです。

日本政府｢｢在日61万人中､徴用者は245人､あとは勝手に来て住み着いた者｣で間違いない｣
https://hayabusa9.5ch.net/test/read.cgi/news/1525094153/
在日韓国人3世に「永住権」なし日韓基本条約で受け入れ義務なし
http://www.thutmosev.com/archives/57555487.html

**名刺は切らしておりまして** · 2018/05/10(木) 15:41:47.19

素直にUNIXをパクればよかったのに、どうして余計なオリジナリティを入れちゃったの？ディレクトリの区切り文字も

**名刺は切らしておりまして** · 2018/05/10(木) 16:27:48.54

>>125
MS-DOS開発時にUNIXはパクられるほどメジャーではなかったからでしょ

**名刺は切らしておりまして** · 2018/05/10(木) 17:43:23.39

昔のDECのOSを真似たのがCP/Mで、さらにそれを真似たのがMS-DOS
PDP-11の頃はCR+LFが改行コードだった

**名刺は切らしておりまして** · 2018/05/10(木) 17:48:16.87

>>125
MS-DOSの源流はCP/Mだから

**名刺は切らしておりまして** · 2018/05/10(木) 17:53:47.81

CRが行頭復帰でLFが行送りだからあってるっちゃあってるんだよ
タイプライターやテレタイプではｗ

**名刺は切らしておりまして** · 2018/05/10(木) 18:02:01.69

>>121
BOMってパイプ処理との相性最悪じゃね

**名刺は切らしておりまして** · 2018/05/10(木) 18:11:03.61

遅きに失した感とはいわないが、遅いよ

**名刺は切らしておりまして** · 2018/05/10(木) 18:12:04.89

BOMごときでごたごたする環境ってKS

**名刺は切らしておりまして** · 2018/05/10(木) 18:12:30.87

改行コードごときでごたごたする環境ってKS

**名刺は切らしておりまして** · 2018/05/10(木) 18:13:24.42

世の中からShift_JIS無くして欲しい

**名刺は切らしておりまして** · 2018/05/10(木) 18:15:40.63

YEN SIGNでゴタゴタする環境ってKS

**名刺は切らしておりまして** · 2018/05/10(木) 18:22:04.68

感動だな

**名刺は切らしておりまして** · 2018/05/10(木) 19:08:18.18

そういや「Linuxの改行コード」であって「UNIXの改行コード」じゃないのね。
商標だから名前を出せないって事情とも思えないけど。

**名刺は切らしておりまして** · 2018/05/10(木) 19:13:26.04

>>134
無くせないんなら重税掛けてほしいな。

**名刺は切らしておりまして** · 2018/05/10(木) 20:12:24.39

UTF-8嫌い。EUCが消えて欲しい

**名刺は切らしておりまして** · 2018/05/10(木) 20:19:56.08

日本のシステム的にはUTF8は無駄の固まり
トラフィックが最大で1.5倍程度になるとか

**名刺は切らしておりまして** · 2018/05/10(木) 22:35:08.43

UTF8はデコードが面倒くさいからUTF16の方がいいな

**名刺は切らしておりまして** · 2018/05/10(木) 23:13:55.56

メモ帳の文字が太めになった　見やすい

**名刺は切らしておりまして** · 2018/05/11(金) 00:19:41.40

日本向け文字コードを云々より、日本人が英語をメインにすべき

まあ無理だろうがな

**名刺は切らしておりまして** · 2018/05/11(金) 01:08:11.19

もうとにかくUTF8で統一しろ
エンコードで時間を浪費するのはもうたくさん

**名刺は切らしておりまして** · 2018/05/11(金) 01:15:03.90

>>144
UTF8はエンコード・デコード時間かかるだろ

**名刺は切らしておりまして** · 2018/05/11(金) 01:36:24.41

>>145
お前が使ってる石は8088とかか？

**名刺は切らしておりまして** · 2018/05/11(金) 01:41:07.28

>>146
それは俺じゃなくて>>144に言うべきだろう

**名刺は切らしておりまして** · 2018/05/11(金) 02:07:06.34

>>145
開発者が文字化けで浪費する時間が無駄だって言ってんの。
現代のPCの性能ならエンコードの処理なんて一瞬だし不可もクソ軽いだろ。

**名刺は切らしておりまして** · 2018/05/11(金) 03:31:52.74

MSは既にOSで稼がない方針になってると聞くけど、

Windowsはオープンソース化すればいいのに

**名刺は切らしておりまして** · 2018/05/11(金) 06:03:24.50

>>147
お前に言ってるんだこのバカ

**名刺は切らしておりまして** · 2018/05/11(金) 10:33:40.60

UTF8 BOMなしで統一してほしい

**名刺は切らしておりまして** · 2018/05/11(金) 12:17:10.77

>>150
それはお門違いだったね

**名刺は切らしておりまして** · 2018/05/11(金) 15:57:52.86

>>149
> Windowsはオープンソース化すればいいのに
着々と進んでるぞ
第一弾はファイルマネージャだ！
https://github.com/Microsoft/winfile

第二弾があるかどうかは知らんけど...

**名刺は切らしておりまして** · 2018/05/11(金) 16:01:45.22

>>152
間抜けは消えろ

**名刺は切らしておりまして** · 2018/05/11(金) 16:07:23.44

>>97
ファイルシステムレベルではもう来てる

**名刺は切らしておりまして** · 2018/05/11(金) 16:17:08.98

UTF-8BOM有無とかUTF-16とかサロゲートペアとか文字コード関連の仕様はめんどくさいわ
統一してくれ

**名刺は切らしておりまして** · 2018/05/11(金) 16:25:07.46

Linuxなんぞ無職以外誰も使わない

**名刺は切らしておりまして** · 2018/05/11(金) 16:29:50.55

自分でサーバー立ててみたりオタッキーなことしようとしたらLinuxは使う

**名刺は切らしておりまして** · 2018/05/11(金) 16:34:33.92

見栄っ張りな俺はFreeBSDだわ

**名刺は切らしておりまして** · 2018/05/11(金) 17:02:06.89

>>159
実力に不相応なまでに虚飾のプライドが高くなる危険性があるよね（自戒）
そういう危険を避ける意味ではlinuxのがおすすめ

**名刺は切らしておりまして** · 2018/05/11(金) 17:15:28.95

EUC-JPの事言うなら、MS932もやめてほしい。

メールもUTF-7で統一しちゃって。

**名刺は切らしておりまして** · 2018/05/11(金) 17:58:26.63

>>143
Muri ja nai yo
Eigo kantan

**名刺は切らしておりまして** · 2018/05/11(金) 18:29:55.42

>>141
サロゲートペア「…」

**名刺は切らしておりまして** · 2018/05/11(金) 18:32:46.26

>>151
まじめに激しく思いっきり同意

**名刺は切らしておりまして** · 2018/05/11(金) 18:38:47.89

>>161
未だに8bit通さないMTAとかあるの？

**名刺は切らしておりまして** · 2018/05/11(金) 19:34:19.79

>>46
馬鹿が発言するとこうなるといういい例ですね

**名刺は切らしておりまして** · 2018/05/11(金) 20:41:47.37

>>160
まあ、趣味だし、自己満だから w

**名刺は切らしておりまして** · 2018/05/11(金) 20:46:09.82

>>151, >>164
だから不要と思えば読み飛ばせよ
メモ帳がいつまでもBOMつけるのもどうかと思うがいつまでもBOMついてたらエラーにするのもどっちもどっちだろ

**名刺は切らしておりまして** · 2018/05/11(金) 22:08:49.57

>>168
BOMついているのを能動的に感知してエラーになる訳じゃなくて、BOMに対応していない多くのアプリケーションで不具合が出るんだよ

utf-8はasciiのみ解釈してそれ以外のバイト列を素通しするだけのフィルタ的なプログラムがそのまま動作するところが大きなメリットなのに

その他の文字コードも基本的にそういう設計思想で作られている

**名刺は切らしておりまして** · 2018/05/11(金) 22:44:27.74

>>169
だからそう言う自分は正しいって言う姿勢をいつまで続けるんだって話
ユーザーから見たらそんなアホな思い込みは迷惑なだけ

**名刺は切らしておりまして** · 2018/05/11(金) 23:44:34.98

>>170
勝手にBOMつけるやつのほうが迷惑

**名刺は切らしておりまして** · 2018/05/12(土) 00:06:50.35

>>170
アプリが個別対応する必要があるんだよ
別にlinuxでもコンパイラとか、テキストファイルとして扱うことが決まっているやつは今どき対応しているが、sedやらawkやらでユーザーがバイナリ的に扱いたいのに勝手に対応されてストリーム加工されるのは迷惑だし

**名刺は切らしておりまして** · 2018/05/12(土) 07:11:27.15

>>171
話の流れを読めないバカは絡んでくるなよ

>>172
> sedやらawkやらでユーザーがバイナリ的に扱いたいのに勝手に対応されてストリーム加工されるのは迷惑だし
ストリームにBOM付きで流すなよ...
ファイルオープンの時に処理すればいいだけでしょ

**名刺は切らしておりまして** · 2018/05/12(土) 08:26:05.29

>>173
ファイルにBOMを記録するなよって話な

**名刺は切らしておりまして** · 2018/05/12(土) 08:34:09.10

ほぼほぼ役に立たないBOMをわざわざつける必要無いわけで

**名刺は切らしておりまして** · 2018/05/12(土) 08:58:04.25

そもそもメタ情報をデータ本体に記録するというのが筋が悪いんだが

**名刺は切らしておりまして** · 2018/05/12(土) 09:18:32.75

>>174-176
だからそんなのはみんなわかってる
それでも文句だけ言ってても誰も幸せにならんだろって話な
「送信は厳格に、受信は寛容に」
RFC 1958 にも書いてある

**名刺は切らしておりまして** · 2018/05/12(土) 10:15:20.24

勝手にBOMつけるソフトってメモ帳以外でもある？

**名刺は切らしておりまして** · 2018/05/12(土) 11:03:21.00

>>173
>>177
個々のコマンドで対応するより前段にBOMStripperかますのが筋がいいと思うよお
sedあたりで作れそうだが

**名刺は切らしておりまして** · 2018/05/12(土) 11:18:50.18

>>179
>>172みたいな人にはそれでいいかもね
ただストリーム云々言ってる奴は実態を知らずに語ってるだけで、実際の問題は設定ファイルが読めないとかデータの頭にゴミか付くとかなのでBOMStripperとやらで対応するのは難しい

**名刺は切らしておりまして** · 2018/05/12(土) 12:07:42.64

文字列UTF8で扱うのにBOM付いたら読めなくなるって
それRFCとか規約通りに実装してないってことだろ？
RFCにはBOMについても記述してあるだろうに

元々BOMの概念がないASCIIやらJIS規格との
共用のために考えられた仕組みなのに、
規約通り実装しないならもうASCIIで全部記述して
日本語とかのマルチバイト入力をアプリで禁止させろ

**名刺は切らしておりまして** · 2018/05/12(土) 12:59:38.25

>>181
文字列UTF8で扱う規定なぞ無い設定ファイルでコメントにutf8入れても、BOM無しなら他の大多数のascii互換のエンコーディングと同様に問題は出ないが、BOM有りだと問題が出る

設定ファイルをメモ帳でちょこっといじってセーブしただけで今まで問題なかったものがおかしくなる。
それをBOMとはなんぞやとわからん様な素人がやるから質悪い

**名刺は切らしておりまして** · 2018/05/12(土) 13:09:31.81

ファイル名やディレクトリ名にスペースが入ってるとバグるプログラム
そんなのを作ってスペース入れるなと文句言ってる無能に似た雰囲気を感じる
Linuxでもスペース入りはサポートしてるのにMSをディスってるのも同じ

**名刺は切らしておりまして** · 2018/05/12(土) 14:26:53.06

BOMの有無を問題視してるバカってどう見ても仕事できない役立たずだわなｗ

**名刺は切らしておりまして** · 2018/05/12(土) 14:40:33.62

IEってWindowsユーザーにはもう使われていないウェブブラウザでしょうか？

**名刺は切らしておりまして** · 2018/05/12(土) 15:13:43.36

>>184
技術的な反論はできないからとりあえず煽ってみました

ってかww

**名刺は切らしておりまして** · 2018/05/12(土) 15:55:58.33

>>186
技術的とかバカかｗ
いまどきBOM非対応ソフトなんて使う方が頭悪いだけ
とっとと捨てろ

**名刺は切らしておりまして** · 2018/05/12(土) 15:58:19.08

メモは使う。

**名刺は切らしておりまして** · 2018/05/12(土) 16:06:29.03

ちゃんとBOMに対応する方が技術力は高いよな？

**名刺は切らしておりまして** · 2018/05/12(土) 16:08:35.99

>>189
そのとおり

**名刺は切らしておりまして** · 2018/05/12(土) 17:47:26.28

頭悪いとしか書けない奴 w

**名刺は切らしておりまして** · 2018/05/12(土) 23:10:00.98

BOM非対応って、どうせ1バイトのASCII前提で、BOMなしファイルだったとしても、フォント指定
したところで日本語をちゃんと表示できないんじゃないかな？

カーソル動かす時に、2バイト文字だと、矢印キーを2回押さないと次の文字へ
移動しないとか、DOS/V時代のスクリーンエディタとかそんなソフトに需要あるか？

**名刺は切らしておりまして** · 2018/05/12(土) 23:37:39.45

メモ帳で.shファイル作ってそのままLinuxで使うと酷い目に遭う
うちの新人がそれでハマって泣きを入れてきた

**名刺は切らしておりまして** · 2018/05/13(日) 02:29:22.42

>>193
シフトJISで保存か

**名刺は切らしておりまして** · 2018/05/13(日) 15:27:55.80

UTF8にバイトオーダーは無いのにエンコード種別判定の
ためにBOMを使うというアイデアがもう古臭い

**名刺は切らしておりまして** · 2018/05/13(日) 17:17:58.54

>>195
知ってる知識で、UTF8とUTF16の違いを説明してよ。 1文字は何バイト？

**名刺は切らしておりまして** · 2018/05/13(日) 18:43:00.83

よく知らんけど1コードポイントでUTF8可変長バイトUTF16 2バイトでは？

**名刺は切らしておりまして** · 2018/05/13(日) 20:58:27.07

奥手党

**名刺は切らしておりまして** · 2018/05/13(日) 22:08:54.74

>>17
それ、行探すだけだろ。

**名刺は切らしておりまして** · 2018/05/14(月) 08:03:41.03

>>199のgrepにはどんなすごい機能があるんだろう？

**名刺は切らしておりまして** · 2018/05/14(月) 08:36:19.34

>>200
grepコマンドはfindstrと違って行ではなく
直接指定した文字を見つけて抜き出せる。

あまり違いがないように見えるけどそれは大間違いで
findstrでは行全体しか抜き出せないけど
grepでは"○○の後ろの3文字"という形でそれだけを抜き出せる。
環境変数として使ったり抜き出した文字を使って新しいファイルを生成したりと
grepの方が使い道が多い。