X



【IT】「メモ帳」がLinuxの改行コードをサポート

■ このスレッドは過去ログ倉庫に格納されています
0001ノチラ ★
垢版 |
2018/05/09(水) 23:51:08.97ID:CAP_USER
 Microsoftの開発者向けイベント“Build 2018”が米国シアトルにて開催中で、今日は2日目のキーノートセッションが行われていました。新しい機械学習技術やクロスデバイス体験などがお披露目されましたが、なかでも会場を沸かせたのがこれ。
https://forest.watch.impress.co.jp/img/wf/docs/1120/764/image1_s.jpg

 なんと「メモ帳」が改行コード“LF(0x0A)”をサポートするのだそうです。Linuxなどで作成されたテキストファイルを「メモ帳」で開くと改行が認識されず、すべて一行で表示されてしまったりしますが、こうした不便が解消されます。

改行コードというのは、テキストの“改行”を表す特殊な文字(制御文字)のこと。一般的に“キャリッジリターン(CR:0x0D)”と“ラインフィード(LF:0x0A)”の2つをいい、もともとはタイプライターで紙を移動させる装置(キャリッジ)を元に戻す(リターン)操作と、紙を一行(ライン)だけ上に送る(フィード)操作を表しているのだそうです。

 どの制御文字を改行コードとして採用するかは歴史的な事情でプラットフォームごとに異なります。

Windows(CR+LF):CRとLFの2文字で改行を表す
Linux(LF):LFのみで改行を表す
古いMac(CR):CRのみで改行を表す
 “行を改めて行頭へカーソルを移動させる”操作を考えるとキャリッジリターンしてラインフィードする“CR+LF”が本来の意味に忠実な気がしますが、それだけのために2文字も使うのは馬鹿らしいという考えにも一理あると思います(現在ではあまり気になりませんが、かつてはメモリもディスクもネットワークも今よりずっと貴重でした)。

 さて、「メモ帳」の改善については公式ブログ“Windows Command Line Tools For Developers”で詳しく説明されていますが、それによると

最新の「Windows 10 Insider Preview」で試せる(編集部にてBuild 17661で確認)
新規作成ファイルは従来通りCR+LFコードで作成される
LFだけでなくCRもサポートする
ステータスバーに改行コードの種類を表示する
互換性に問題がある場合はレジストリを編集して元の挙動に戻せるようにする
のだそうです。Linuxで開発されたソフトのライセンスや利用許諾、設定ファイルはLFコードで書かれていることが多いですが、わざわざサードパーティ製のテキストエディターをダウンロードしなくても「メモ帳」で閲覧・印刷できるようになるのは結構うれしいですね。
https://forest.watch.impress.co.jp/docs/serial/yajiuma/1120764.html
0101名刺は切らしておりまして
垢版 |
2018/05/10(木) 07:31:39.83ID:DAUVatuR
>>92
パイソンはちょっとしたものを作るのに優れてるけど、大規模開発に耐えられるかなぁ〜?
0103名刺は切らしておりまして
垢版 |
2018/05/10(木) 07:52:18.84ID:5sGyyhU7
>>62
BOM付けないと、エンコーディング指定できないメモ帳では何の文字コードで表示すればいいか分からんだろ
0107名刺は切らしておりまして
垢版 |
2018/05/10(木) 08:34:18.01ID:aVM26dH4
>>101
そもそも大規模って何作るのさ
いくつかの小さなPythonコードと、
大規模データベースと、HTMLのUI繋げりゃ
大抵の用途はカバーできると思うが
0108名刺は切らしておりまして
垢版 |
2018/05/10(木) 08:38:57.69ID:DAUVatuR
>>107
大規模開発やったことないの?
自分はそこまで本格的な小規模開発やったことないけど。
0109名刺は切らしておりまして
垢版 |
2018/05/10(木) 08:50:10.21ID:FpoxmYUb
>>2
異なる改行コードが混在してたらどう表示して保存時にどうすればいいのかとか
CRLFじゃなくてLFCRだったら1つの改行にするのか2つの改行にするのかとか
イレギュラーなケースを考え始めると面倒くさくなって
まいっかで放置する気持ちはわかる
0110名刺は切らしておりまして
垢版 |
2018/05/10(木) 08:53:31.42ID:6JfyxkZx
>>2
この皮肉がわからない奴は
外であまり喋らない方がいい
0112名刺は切らしておりまして
垢版 |
2018/05/10(木) 08:58:25.04ID:2VlUbJK2
まじリナックス化し始めたw
0115名刺は切らしておりまして
垢版 |
2018/05/10(木) 11:03:32.50ID:w1mLyGHY
>>44
どういう意味?
0116名刺は切らしておりまして
垢版 |
2018/05/10(木) 11:09:04.75ID:wir5s59N
メモ帳の対応より先にテキストファイルの改行コードすら統一出来てない方を問題視しろよ
0119名刺は切らしておりまして
垢版 |
2018/05/10(木) 12:40:03.61ID:H+wiPboS
>>118
WSLを有効にしてください
0122名刺は切らしておりまして
垢版 |
2018/05/10(木) 13:12:12.27ID:npS2yEeJ
この豆腐みたいのはなんですか?
0123名刺は切らしておりまして
垢版 |
2018/05/10(木) 13:37:34.16ID://aANdsR
要するに、ソフトのインストールが制限される派遣とかには朗報って事?
0124名刺は切らしておりまして
垢版 |
2018/05/10(木) 14:00:48.18ID:B4lOB274
在日韓国・朝鮮人は単なる「不法入国犯罪者」です。

戦後の混乱で強制送還できず、しかたなく「朝鮮戦争の難民」という扱いで
特別に在留を法的に許可してる状態です。

つまり、朝鮮戦争が終結すると祖国へ帰らなければならないのです。

日本政府「「在日61万人中、徴用者は245人、あとは勝手に来て住み着いた者」で間違いない」
https://hayabusa9.5ch.net/test/read.cgi/news/1525094153/
在日韓国人3世に「永住権」なし 日韓基本条約で受け入れ義務なし
http://www.thutmosev.com/archives/57555487.html
0125名刺は切らしておりまして
垢版 |
2018/05/10(木) 15:41:47.19ID:JC3wKH/3
素直にUNIXをパクればよかったのに、どうして余計なオリジナリティを入れちゃったの? ディレクトリの区切り文字も
0126名刺は切らしておりまして
垢版 |
2018/05/10(木) 16:27:48.54ID:99SpLHGa
>>125
MS-DOS開発時にUNIXはパクられるほどメジャーではなかったからでしょ
0127名刺は切らしておりまして
垢版 |
2018/05/10(木) 17:43:23.39ID:x3RzgmPQ
昔のDECのOSを真似たのがCP/Mで、さらにそれを真似たのがMS-DOS
PDP-11の頃はCR+LFが改行コードだった
0129名刺は切らしておりまして
垢版 |
2018/05/10(木) 17:53:47.81ID:5enLdQeP
CRが行頭復帰でLFが行送りだからあってるっちゃあってるんだよ
タイプライターやテレタイプではw
0131名刺は切らしておりまして
垢版 |
2018/05/10(木) 18:11:03.61ID:stt5Lt9L
遅きに失した感とはいわないが、遅いよ
0132名刺は切らしておりまして
垢版 |
2018/05/10(木) 18:12:04.89ID:stt5Lt9L
BOMごときでごたごたする環境ってKS
0133名刺は切らしておりまして
垢版 |
2018/05/10(木) 18:12:30.87ID:stt5Lt9L
改行コードごときでごたごたする環境ってKS
0134名刺は切らしておりまして
垢版 |
2018/05/10(木) 18:13:24.42ID:stt5Lt9L
世の中からShift_JIS無くして欲しい
0135名刺は切らしておりまして
垢版 |
2018/05/10(木) 18:15:40.63ID:stt5Lt9L
YEN SIGNでゴタゴタする環境ってKS
0136名刺は切らしておりまして
垢版 |
2018/05/10(木) 18:22:04.68ID:EUKvFMcG
感動だな
0137名刺は切らしておりまして
垢版 |
2018/05/10(木) 19:08:18.18ID:sJkU+t2X
そういや「Linuxの改行コード」であって「UNIXの改行コード」じゃないのね。
商標だから名前を出せないって事情とも思えないけど。
0141名刺は切らしておりまして
垢版 |
2018/05/10(木) 22:35:08.43ID:8yipGni4
UTF8はデコードが面倒くさいからUTF16の方がいいな
0142名刺は切らしておりまして
垢版 |
2018/05/10(木) 23:13:55.56ID:+UNZv/QQ
メモ帳の文字が太めになった 見やすい
0143名刺は切らしておりまして
垢版 |
2018/05/11(金) 00:19:41.40ID:1funEvCI
日本向け文字コードを云々より、日本人が英語をメインにすべき

まあ無理だろうがな
0145名刺は切らしておりまして
垢版 |
2018/05/11(金) 01:15:03.90ID:wPHhB5zj
>>144
UTF8はエンコード・デコード時間かかるだろ
0146名刺は切らしておりまして
垢版 |
2018/05/11(金) 01:36:24.41ID:le+Yfv/x
>>145
お前が使ってる石は8088とかか?
0147名刺は切らしておりまして
垢版 |
2018/05/11(金) 01:41:07.28ID:NNAsEr6t
>>146
それは俺じゃなくて>>144に言うべきだろう
0148名刺は切らしておりまして
垢版 |
2018/05/11(金) 02:07:06.34ID:OiSgf9ew
>>145
開発者が文字化けで浪費する時間が無駄だって言ってんの。
現代のPCの性能ならエンコードの処理なんて一瞬だし不可もクソ軽いだろ。
0149名刺は切らしておりまして
垢版 |
2018/05/11(金) 03:31:52.74ID:BRQVj3k2
MSは既にOSで稼がない方針になってると聞くけど、

Windowsはオープンソース化すればいいのに
0150名刺は切らしておりまして
垢版 |
2018/05/11(金) 06:03:24.50ID:le+Yfv/x
>>147
お前に言ってるんだこのバカ
0151名刺は切らしておりまして
垢版 |
2018/05/11(金) 10:33:40.60ID:QobxAl2d
UTF8 BOMなしで統一してほしい
0152名刺は切らしておりまして
垢版 |
2018/05/11(金) 12:17:10.77ID:NNAsEr6t
>>150
それはお門違いだったね
0154名刺は切らしておりまして
垢版 |
2018/05/11(金) 16:01:45.22ID:le+Yfv/x
>>152
間抜けは消えろ
0156名刺は切らしておりまして
垢版 |
2018/05/11(金) 16:17:08.98ID:562LSlFH
UTF-8BOM有無とかUTF-16とかサロゲートペアとか文字コード関連の仕様はめんどくさいわ
統一してくれ
0157名刺は切らしておりまして
垢版 |
2018/05/11(金) 16:25:07.46ID:3pYOtuiN
Linuxなんぞ無職以外誰も使わない
0160名刺は切らしておりまして
垢版 |
2018/05/11(金) 17:02:06.89ID:H31Hk8XC
>>159
実力に不相応なまでに虚飾のプライドが高くなる危険性があるよね(自戒)
そういう危険を避ける意味ではlinuxのがおすすめ
0161名刺は切らしておりまして
垢版 |
2018/05/11(金) 17:15:28.95ID:l1tblL6q
EUC-JPの事言うなら、MS932もやめてほしい。

メールもUTF-7で統一しちゃって。
0163名刺は切らしておりまして
垢版 |
2018/05/11(金) 18:29:55.42ID:7YIToWbW
>>141
サロゲートペア「…」
0164名刺は切らしておりまして
垢版 |
2018/05/11(金) 18:32:46.26ID:7YIToWbW
>>151
まじめに激しく思いっきり同意
0165名刺は切らしておりまして
垢版 |
2018/05/11(金) 18:38:47.89ID:7YIToWbW
>>161
未だに8bit通さないMTAとかあるの?
0168名刺は切らしておりまして
垢版 |
2018/05/11(金) 20:46:09.82ID:ckUjiwq1
>>151, >>164
だから不要と思えば読み飛ばせよ
メモ帳がいつまでもBOMつけるのもどうかと思うがいつまでもBOMついてたらエラーにするのもどっちもどっちだろ
0169名刺は切らしておりまして
垢版 |
2018/05/11(金) 22:08:49.57ID:72aEpV3q
>>168
BOMついているのを能動的に感知してエラーになる訳じゃなくて、BOMに対応していない多くのアプリケーションで不具合が出るんだよ

utf-8はasciiのみ解釈してそれ以外のバイト列を素通しするだけのフィルタ的なプログラムがそのまま動作するところが大きなメリットなのに

その他の文字コードも基本的にそういう設計思想で作られている
0170名刺は切らしておりまして
垢版 |
2018/05/11(金) 22:44:27.74ID:aylu31S1
>>169
だからそう言う自分は正しいって言う姿勢をいつまで続けるんだって話
ユーザーから見たらそんなアホな思い込みは迷惑なだけ
0171名刺は切らしておりまして
垢版 |
2018/05/11(金) 23:44:34.98ID:ssNPwNtq
>>170
勝手にBOMつけるやつのほうが迷惑
0172名刺は切らしておりまして
垢版 |
2018/05/12(土) 00:06:50.35ID:e0WdL+kZ
>>170
アプリが個別対応する必要があるんだよ
別にlinuxでもコンパイラとか、テキストファイルとして扱うことが決まっているやつは今どき対応しているが、sedやらawkやらでユーザーがバイナリ的に扱いたいのに勝手に対応されてストリーム加工されるのは迷惑だし
0173名刺は切らしておりまして
垢版 |
2018/05/12(土) 07:11:27.15ID:Idcmo9kj
>>171
話の流れを読めないバカは絡んでくるなよ

>>172
> sedやらawkやらでユーザーがバイナリ的に扱いたいのに勝手に対応されてストリーム加工されるのは迷惑だし
ストリームにBOM付きで流すなよ...
ファイルオープンの時に処理すればいいだけでしょ
0174名刺は切らしておりまして
垢版 |
2018/05/12(土) 08:26:05.29ID:59fTT8ak
>>173
ファイルにBOMを記録するなよって話な
0175名刺は切らしておりまして
垢版 |
2018/05/12(土) 08:34:09.10ID:59fTT8ak
ほぼほぼ役に立たないBOMをわざわざつける必要無いわけで
0177名刺は切らしておりまして
垢版 |
2018/05/12(土) 09:18:32.75ID:Idcmo9kj
>>174-176
だからそんなのはみんなわかってる
それでも文句だけ言ってても誰も幸せにならんだろって話な
「送信は厳格に、受信は寛容に」
RFC 1958 にも書いてある
0178名刺は切らしておりまして
垢版 |
2018/05/12(土) 10:15:20.24ID:gs+CwTOh
勝手にBOMつけるソフトってメモ帳以外でもある?
0180名刺は切らしておりまして
垢版 |
2018/05/12(土) 11:18:50.18ID:Idcmo9kj
>>179
>>172みたいな人にはそれでいいかもね
ただストリーム云々言ってる奴は実態を知らずに語ってるだけで、実際の問題は設定ファイルが読めないとかデータの頭にゴミか付くとかなのでBOMStripperとやらで対応するのは難しい
0181名刺は切らしておりまして
垢版 |
2018/05/12(土) 12:07:42.64ID:+SC5Qsp9
文字列UTF8で扱うのにBOM付いたら読めなくなるって
それRFCとか規約通りに実装してないってことだろ?
RFCにはBOMについても記述してあるだろうに

元々BOMの概念がないASCIIやらJIS規格との
共用のために考えられた仕組みなのに、
規約通り実装しないならもうASCIIで全部記述して
日本語とかのマルチバイト入力をアプリで禁止させろ
0182名刺は切らしておりまして
垢版 |
2018/05/12(土) 12:59:38.25ID:e0WdL+kZ
>>181
文字列UTF8で扱う規定なぞ無い設定ファイルでコメントにutf8入れても、BOM無しなら他の大多数のascii互換のエンコーディングと同様に問題は出ないが、BOM有りだと問題が出る

設定ファイルをメモ帳でちょこっといじってセーブしただけで今まで問題なかったものがおかしくなる。
それをBOMとはなんぞやとわからん様な素人がやるから質悪い
0183名刺は切らしておりまして
垢版 |
2018/05/12(土) 13:09:31.81ID:f3cYdwP9
ファイル名やディレクトリ名にスペースが入ってるとバグるプログラム
そんなのを作ってスペース入れるなと文句言ってる無能に似た雰囲気を感じる
Linuxでもスペース入りはサポートしてるのにMSをディスってるのも同じ
0184名刺は切らしておりまして
垢版 |
2018/05/12(土) 14:26:53.06ID:DpEpVbaP
BOMの有無を問題視してるバカってどう見ても仕事できない役立たずだわなw
0185名刺は切らしておりまして
垢版 |
2018/05/12(土) 14:40:33.62ID:6CkIhuqV
IEってWindowsユーザーにはもう使われていないウェブブラウザでしょうか?
0187名刺は切らしておりまして
垢版 |
2018/05/12(土) 15:55:58.33ID:DpEpVbaP
>>186
技術的とかバカかw
いまどきBOM非対応ソフトなんて使う方が頭悪いだけ
とっとと捨てろ
0188名刺は切らしておりまして
垢版 |
2018/05/12(土) 15:58:19.08ID:DxkcnK4A
メモは使う。
0190名刺は切らしておりまして
垢版 |
2018/05/12(土) 16:08:35.99ID:7VNsorF5
>>189
そのとおり
0192名刺は切らしておりまして
垢版 |
2018/05/12(土) 23:10:00.98ID:pikePwk/
BOM非対応って、どうせ1バイトのASCII前提で、BOMなしファイルだったとしても、フォント指定
したところで日本語をちゃんと表示できないんじゃないかな?

カーソル動かす時に、2バイト文字だと、矢印キーを2回押さないと次の文字へ
移動しないとか、DOS/V時代のスクリーンエディタとかそんなソフトに需要あるか?
0193名刺は切らしておりまして
垢版 |
2018/05/12(土) 23:37:39.45ID:W4LHh7iO
メモ帳で.shファイル作ってそのままLinuxで使うと酷い目に遭う
うちの新人がそれでハマって泣きを入れてきた
0194名刺は切らしておりまして
垢版 |
2018/05/13(日) 02:29:22.42ID:/dQh4MSq
>>193
シフトJISで保存か
0195名刺は切らしておりまして
垢版 |
2018/05/13(日) 15:27:55.80ID:HywrrIMb
UTF8にバイトオーダーは無いのにエンコード種別判定の
ためにBOMを使うというアイデアがもう古臭い
0196名刺は切らしておりまして
垢版 |
2018/05/13(日) 17:17:58.54ID:7dFZ7lOS
>>195
知ってる知識で、UTF8とUTF16の違いを説明してよ。 1文字は何バイト?
0201名刺は切らしておりまして
垢版 |
2018/05/14(月) 08:36:19.34ID:98wSYhy/
>>200
grepコマンドはfindstrと違って行ではなく
直接指定した文字を見つけて抜き出せる。

あまり違いがないように見えるけどそれは大間違いで
findstrでは行全体しか抜き出せないけど
grepでは"○○の後ろの3文字"という形でそれだけを抜き出せる。
環境変数として使ったり抜き出した文字を使って新しいファイルを生成したりと
grepの方が使い道が多い。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況