【話題】「Excelが日付に変換してしまうから」一部遺伝子の名称を変更。ヒトゲノム解析の科学者ら [しじみ★]
■ このスレッドは過去ログ倉庫に格納されています
人のゲノムには無数の遺伝子が含まれており、DNAとRNAの微妙な組み合わせがひとりひとりにユニークな特徴を与えています。ゲノム解析の研究者らは、これら遺伝子のひとつひとつに記号と英数字を組み合わせたコードで名前をつけ、分別して研究に役立てています。
とことが、ここ最近の解析で付与された遺伝子の"名前"は、非常に扱いにくいことで問題となりました。なぜなら、マイクロソフトの表計算ソフトExcelが、これら遺伝子の名前を入力したセルを勝手に日付だと勘違いするから。
Excelの自動書式設定機能は、日付を簡単に入力できるようにデフォルト設定されており、たとえば”12/1”と入力すれば12割る1ではなく、12月1日に変換します。国際ヒトゲノム解析機構(HUGO)のなかのゲノム命名法委員会(HGNC)の人たちが困ってしまったのは、遺伝子に付けられた名前”Membrane Associated Ring-CH-Type Finger 1”の略称” MARCH1 ”をExcelに入力すると、勝手に”3月1日”に変換されてしまう現象でした。
厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
同様の変換によって日付になってしまう遺伝子は多数あり、2016年に発表された遺伝学関連論文の約1/5にExcelの自動変換機能が影響を与えていたとされます。そしてHGNCではこのようなエラーの発生を防止するため、過去1年間で合計27個の遺伝子の名前を変えてきたとのこと。例を挙げるなら、” MARCH1 ”という記号を” MARCHF1 ”に、” SEPT1 ”を” SEPTIN1 ”に、といった具合。しかし、まだ自動変換にひっかかるすべての名前を変更し終わったわけではありません。
これまでにも一度つけられた遺伝子の名前が変更された例はあるものの、それらは検索時に誤検出を起こしたり、その名称が特定の人々に懸念を抱かせるようなものだったりしたため。今回のようにたまたま使っているアプリケーションソフトの標準機能のせいで名称を変えるという例は少なくともいままではありませんでした。
科学者であれど当たり前に使用するExcelですが、アプリケーションとしてはより一般的な用途に向けて設計されていることから、マイクロソフトが今回のような特定の分野の問題のためにパッチなどを用意することはなさそうな雰囲気。HGNCのコーディネーターであるElspeth Bruford氏もこの問題は「非常に限られた使用例」であり、書式の自動変換を無効化するオプションはごく一部の人たちの助けにしかならないと述べました。
ところで、Excelはセル内容の自動変換をオフにする設定項目は用意していませんが、入力する文字列の最初にシングルクォーテーションを入れれば、以降の値を文字列として処理するルールがあります。たとえば” MARCH1 ”なら、” ’MARCH1 ”と入力すれば、それは問題なく文字列として扱われるはずなのですが…?おそらくは、それでも解決できない特殊な不具合があったのでしょう。きっとそうに違いありません。
https://japanese.engadget.com/rename-genes-due-to-excel-043027343.html >入力する文字列の最初にシングルクォーテーションを入れれば、以降の値を文字列として処理するルールがあります
解決しとるやんけ >>1
>以降の値を文字列として処理するルールがあります。たとえば” MARCH1 ”なら、” ’MARCH1 ”と入力すれば、それは問題なく文字列として扱われるはずなのです
数字とコードの区別もしてもらえず 0始まりコードも改竄され迷惑
セルの書式設定で標準>>文字列にしておく excelが完璧すぎるとwordさんが死ぬから仕方ないね
>>4
しとらんやろがい エクセルもだけどiOSのアルファベット変換のアホさ加減を何とかしろよ。 オフィスの使用を法律で禁止すべきだ
実質的な性能は20年以上まったく変わっていない
マックのパクリだった windows でただ、すべての競争相手を潰すことで
試乗を独占し、陳腐なエクセルやワードを売りつけてきた
日本人は馬鹿だね、本当に シングルクォーテーションも入れる必要ねーよw
セルのフォーマットを「テキスト」に設定すれば、内容の勝手な変更はされなくなる。
自分であれこれ解決策を探しても分からなかったとしても、
ぐぐればすぐに答えが見つかるぞ。
学者さんなら、それくらいの工夫はしろや。 >>3
元が数値で必要なときに
日付に属性変えればいいのに
基本設定後逆なのがおかしいんだよ >>1
なにこの頭悪い記事
頭にカンマ
か
属性を文字列か値
にすればいいだけじゃん
データベースとかの集計をマクロやってる人なら初歩中の初歩の話し
記事書いてる人がくるくるパーなんだろうな
アーメン > Excelの自動書式設定機能は
こういうのすごい邪魔。CSVインポートの時とか特に面倒臭い。 大抵の文章はWordよりExcelで作ったほうが手っ取り早い >>10
実際それでやってみ。ちょっとコピーとか移動するだけで、すべて破綻するから。 >>8
EXCELはそもそもMac用のソフトだったのだが >>15
CSVとかマジで面倒だよな
勝手に頭の0を省いて数値型に変換するし >>15
そうそう、CSVでインポートする手前で ’ 入れるツール作る羽目になる。
しかも ’ 入れたところでちょっと操作するだけで破綻する
Excelは人類を破滅に導くクソツール >>1
仕事に耐えられないゴミソフト
>>17
それはさすがにコードを書けない情弱一般市民が悪い ’ 入れて数値化を避けても、へんなアイコンつけてエラー扱いするキチガイっぷり
クソゴミソフトExcel だよねー
全ての科学者が被害を被ってるからMicrosoftに賠償請求しようぜ >>21
そもそも仕様の曖昧なCSVを現代でも使うなと。 自動書式のようなユーザインタフェースと、データベースとしての機能が同居してる時点で、そもそも業務向きではない
設計思想からして何もかも間違っている CSVエクスポートしたデータを、そのままCSVインポートすると、
自動書式のせいでデータが変わると言うトンデモ仕様。
macのnumbersはもっと酷くて、インポート書式変更不可、「'」無視。よって、データ再現不可というクソ仕様。 >>13
excelの使い方っていうパソコンの大先生レベルでドヤっちゃう男の人つて(笑) んー、エンガジェットのライターもレベルが低いな
元のvergeにはこう書いてあるし
There’s no easy fix, either. Excel doesn’t offer the option to turn off this auto-formatting, and the only way to avoid it is to change the data type for individual columns. Even then, a scientist might fix their data but export it as a CSV file without saving the formatting. Or, another scientist might load the data without the correct formatting, changing gene symbols back into dates. The end result is that while knowledgeable Excel users can avoid this problem, it’s easy for mistakes to be introduced.
PC watchではこう表現している
これらの“自動変換”は、そのセルに入力した時点で「書式」が「日付」であるとExcelに認識され、それに則って表示されるだけなので、オートコンプリートやオートコレクトをオフにしただけでは切ることができない。加えて、入力したあとに書式を「文字列」に設定しても数字となるので厄介だ。回避するには、あらかじめそのセルの書式を文字列として指定しておくしかない。
ただ、今回HGNCはそうしたExcelの使い方をレクチャーするのではなく、遺伝子の名前を変更することで対応を行なうようだ。先述の「MARCH1」は「MARCHF1」、「SEPT1」は「SEPTIN1」といったように変更することで、自動変換されてしまうのを回避する。
上から目線で嫌味っぽくあんな書き方するくらいならせめて裏取りくらいはしてからにしろよ、恥ずかしいな… >>8
そういうのは市場独占型戦略って言って立派な経営戦略
一般的に日本では顧客満足型が多いけどな 「Excelが日付に変換してしまうから」という名前にしたのかと思ったw
Space X の 1 段目ロケット用着陸用デッキの名前みたいなw インポートするときだろ
ニワカはだまってろ
属性変更とかは常識 自動変換無効化と
語彙のアルゴリズム取っ払ったら
パソコンの入力速度を上げるしかないと思うけど、めんどくさいよね。
多分・・・そこまで、訓練する人もいないだろうし。
それでいいんでないの? >2016年に発表された遺伝学関連論文の約1/5に
>Excelの自動変換機能が影響を与えていたとされます。
それはそれで凄い話だ 自動変換をオフにする設定項目が無い?
データの型を日付から文字列にするだけじゃねーの? >>15
全書式を文字列にしたテンプレートを作って、初期テンプレートに指定すれば余裕 データ解析とか他のソフトで生成したデータを
エクセルに移すときに面倒が増えるわけだな 本当にクソ仕様なのは
年月日に誤変換された文字を書式設定で文字列にしたら数列に変換されることだろ データベースにインポートしたい時はエクセルはデータ型曖昧だから面倒なんだよな >>30
便利というより知名度だな。
Excelって言っておけば誰にでも通じるから。 呼称・略称・略号が既存の単語になっているのは誤りのもとである 〜すれば?っていうのを科学者全員に要求するのが無理なんだよ。
遺伝子のことで頭が一杯でさ。 >>8
オフィスが禁止されたら世界経済が混乱するぞ
Windows+Officeは経済のインフラだから >>17
WORD2010から一太郎文書の読み込み機能を無くしたMicrosoftを一生許さない
>>18
値だけ貼り付けてもダメか?
>>19
Windowsl98の頃まではLotus1-2-3がExcelよりずっと使い勝手が良かったのに 有能なのが3人程度集まれば文殊の知恵だが、
中途半端なのが大勢集まるとロクなことにならないという好例 何人かの人も言ってるけど、
セルの書式を文字列に変えることで
解決する話なんでないの? 弥生って名付けるか
LibreOfficeで良いじゃん 元記事のvergeの大事な所を
>>33
に引用してあるからそれくらい読んでから書き込みした方がいいぞ
あの程度の英語も理解できない知能なら書き込みしなくていい >>33
なるほど
CSV形式で出力するとEXCELの書式が保存されないわけか そういうドキュメント作るたびに毎回毎回毎回毎回設定してチェックするという
生産性のない作業を繰り返すのは、勤勉な愚か者だけで十分ということです おまえらまじでしらんようだからいっとくがインフルでさえ20-30パーセントの人しか効果ない
それも以前より効いたというアンケート BYWHO
素晴らしいマスごみの隠蔽
.
死亡感染 コロナ<<インフル 熱中症(マスクバカ)不況自殺 事故死 宝くじ
また新型タイプ発覚だってよwやっぱ捕まったハーバードのチャールズリーバー一味がまいてんだろな
検索→新型コロナ詐欺 ウェブノード >マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
どんだけクソ仕様なんだよ・・・ >>13
頭にカンマ?
シングルクオートじゃなくて? >>1
記事にはシングルコーテーションと書きながら、「"」ダブルで書かれてるのだが、どちらでもいいのか? なんでそんな仕打ちまで受けながらexcelを使うんだ? >>1
あたまに「'」を付けるとそのセルの値を文字列と認識してくれるぞ
当然数値計算はできなくなる すげーよく分かる
csvでデータを渡すと「なんか日付が変だよ」とか言われて、見ると勝手に変換とか良くある
まあでも、今となっては、xlsxでやりとりしてWindows以外の人で困るのは、印刷の時くらいだよね >>52
その通りなんですが、CSVで吐き出した遺伝子名一覧とかを、他の科学者に公開することもあるので。
解析した人間が理解してても、受け取った共同研究者なりが
無邪気にexcelで開いて、そのexcelバージョンを
データとして登録するとか、良くあります。 一太郎使えよ
埼玉県庁の申請書類はジャストシステム >>1
> 科学者であれど当たり前に使用するExcel
ないわー。
文書作るのにWordってのはまだありだが、
表計算ソフトは無用の長物。
プレーンテキストとシェルスクリプト、awk,sed,grep辺り駆使した方が
楽だし幅広く応用が効く。 クソエクセルの仕様を理解しないデータを送ってくる馬鹿のせいで
どんだけの人が日々残業してるかと思うと wardで論文書くと図表番号がずれて意味不明になるぞ >>74
>awk,sed,grep辺り駆使した方が
どんな分野の科学者にいいの?
文字列処理メイン?だったらかなり狭くない? >>74
スクリプトキディかよ
cliなんぞ使えないら使いたくない研究者の事が全くわかってないね
社会に出てから書き込んだほうがいいぞ >>76
余計な自動機能は真っ先に切るよ?
Word使う理由は比較的手軽にレイアウトを事細かにパラメータ設定できるとこでしょ。
>>77
?
文字列処理が要らないんだったら、それこそ表計算ソフト無用だろ。 >厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
そうなのか書式設定したり、予めしてあるテンプレート使えばいいんじゃないのか cvsをexcelで開くとテンプレートが効かない罠 >> マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
マイクロソフトがこの設定機能パッチで緊急に追加するのがスジだと思う。 >>70
あー!そういうことですか!
確かにありますね!
自分は.から始まる数値データを勝手に
「0.nn」みたいに頭に0つけられましたわ、、。 csvを作るためのインターフェイスとしてだけはexcelって優秀だと思う。 解決方法は色々あるけど、誤認識されないデータの方が捗るだろうな >>85
csv専門のエディタあるけど、
Excelほど機能が充実してないし、
操作も慣れてるExcelの方が良い、
となりますからねえ なぜexcelにこだわるかな
スプレッドシートは他にもあるだろ >>65
文章中で値を明示する時とか強調する時に "ダブルクォーテーション" で囲うんだよ
当然入力時にはダブルクォーテーションを除いて入力する
あとシングルクォーテーションを全角で書いてるのはこんな風に "'わかりにくくなる" からだと思う
実際の入力時は半角シングルクォーテーションで入力する必要がある >>77
それで済まない領域ならPythonとか使えばデータ処理も楽々ですよ
データの数が数千件を超えるならSQLite3とかのDB入れればいい >>80
普通の会社で働いたらわかると思うよ
って研究者の話だよな
その世界でもExcelって浸透してるんだな、ちょっとびっくり そうならない表計算ソフトを作ってる会社の株って売ってる? >>79
あー、スマソ、あなたは>>74で
「文書作るのに〜表計算ソフトは無用の長物」と書いたとき、
「科学者であれど当たり前に使用する」という1の記事を、
文書作成ソフトとして、と前置きしちゃって読んでたのね。:
そりゃExcelを使う動機が「文字列処理」となるわけだ。
表計算ながら文字列処理に《も》使えるExcel、とは認識差だな。 >>4
シングルクォーテーションを使うやり方では、見落としが生じやすく、後々、
混乱を招くから、あえて、明確に名前を変えることを選んだのだと思う。 オフにできるだろw
文字列セルに変更すりゃ大丈夫なはず ■ このスレッドは過去ログ倉庫に格納されています