【話題】「Excelが日付に変換してしまうから」一部遺伝子の名称を変更。ヒトゲノム解析の科学者ら [しじみ★]
■ このスレッドは過去ログ倉庫に格納されています
人のゲノムには無数の遺伝子が含まれており、DNAとRNAの微妙な組み合わせがひとりひとりにユニークな特徴を与えています。ゲノム解析の研究者らは、これら遺伝子のひとつひとつに記号と英数字を組み合わせたコードで名前をつけ、分別して研究に役立てています。
とことが、ここ最近の解析で付与された遺伝子の"名前"は、非常に扱いにくいことで問題となりました。なぜなら、マイクロソフトの表計算ソフトExcelが、これら遺伝子の名前を入力したセルを勝手に日付だと勘違いするから。
Excelの自動書式設定機能は、日付を簡単に入力できるようにデフォルト設定されており、たとえば”12/1”と入力すれば12割る1ではなく、12月1日に変換します。国際ヒトゲノム解析機構(HUGO)のなかのゲノム命名法委員会(HGNC)の人たちが困ってしまったのは、遺伝子に付けられた名前”Membrane Associated Ring-CH-Type Finger 1”の略称” MARCH1 ”をExcelに入力すると、勝手に”3月1日”に変換されてしまう現象でした。
厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
同様の変換によって日付になってしまう遺伝子は多数あり、2016年に発表された遺伝学関連論文の約1/5にExcelの自動変換機能が影響を与えていたとされます。そしてHGNCではこのようなエラーの発生を防止するため、過去1年間で合計27個の遺伝子の名前を変えてきたとのこと。例を挙げるなら、” MARCH1 ”という記号を” MARCHF1 ”に、” SEPT1 ”を” SEPTIN1 ”に、といった具合。しかし、まだ自動変換にひっかかるすべての名前を変更し終わったわけではありません。
これまでにも一度つけられた遺伝子の名前が変更された例はあるものの、それらは検索時に誤検出を起こしたり、その名称が特定の人々に懸念を抱かせるようなものだったりしたため。今回のようにたまたま使っているアプリケーションソフトの標準機能のせいで名称を変えるという例は少なくともいままではありませんでした。
科学者であれど当たり前に使用するExcelですが、アプリケーションとしてはより一般的な用途に向けて設計されていることから、マイクロソフトが今回のような特定の分野の問題のためにパッチなどを用意することはなさそうな雰囲気。HGNCのコーディネーターであるElspeth Bruford氏もこの問題は「非常に限られた使用例」であり、書式の自動変換を無効化するオプションはごく一部の人たちの助けにしかならないと述べました。
ところで、Excelはセル内容の自動変換をオフにする設定項目は用意していませんが、入力する文字列の最初にシングルクォーテーションを入れれば、以降の値を文字列として処理するルールがあります。たとえば” MARCH1 ”なら、” ’MARCH1 ”と入力すれば、それは問題なく文字列として扱われるはずなのですが…?おそらくは、それでも解決できない特殊な不具合があったのでしょう。きっとそうに違いありません。
https://japanese.engadget.com/rename-genes-due-to-excel-043027343.html >厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
そうなのか書式設定したり、予めしてあるテンプレート使えばいいんじゃないのか cvsをexcelで開くとテンプレートが効かない罠 >> マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
マイクロソフトがこの設定機能パッチで緊急に追加するのがスジだと思う。 >>70
あー!そういうことですか!
確かにありますね!
自分は.から始まる数値データを勝手に
「0.nn」みたいに頭に0つけられましたわ、、。 csvを作るためのインターフェイスとしてだけはexcelって優秀だと思う。 解決方法は色々あるけど、誤認識されないデータの方が捗るだろうな >>85
csv専門のエディタあるけど、
Excelほど機能が充実してないし、
操作も慣れてるExcelの方が良い、
となりますからねえ なぜexcelにこだわるかな
スプレッドシートは他にもあるだろ >>65
文章中で値を明示する時とか強調する時に "ダブルクォーテーション" で囲うんだよ
当然入力時にはダブルクォーテーションを除いて入力する
あとシングルクォーテーションを全角で書いてるのはこんな風に "'わかりにくくなる" からだと思う
実際の入力時は半角シングルクォーテーションで入力する必要がある >>77
それで済まない領域ならPythonとか使えばデータ処理も楽々ですよ
データの数が数千件を超えるならSQLite3とかのDB入れればいい >>80
普通の会社で働いたらわかると思うよ
って研究者の話だよな
その世界でもExcelって浸透してるんだな、ちょっとびっくり そうならない表計算ソフトを作ってる会社の株って売ってる? >>79
あー、スマソ、あなたは>>74で
「文書作るのに〜表計算ソフトは無用の長物」と書いたとき、
「科学者であれど当たり前に使用する」という1の記事を、
文書作成ソフトとして、と前置きしちゃって読んでたのね。:
そりゃExcelを使う動機が「文字列処理」となるわけだ。
表計算ながら文字列処理に《も》使えるExcel、とは認識差だな。 >>4
シングルクォーテーションを使うやり方では、見落としが生じやすく、後々、
混乱を招くから、あえて、明確に名前を変えることを選んだのだと思う。 オフにできるだろw
文字列セルに変更すりゃ大丈夫なはず >>48
新型コロナよりは影響小さいんじゃね?
会社でExcel使いまくってるけどw csv読み込みでの日付変更は今まさに仕事でハマっている部分だわ。研究機関だとcsvが共通フォーマットだからダウンロードして開くと所々日付になっててすげー困る 年賀状を作るとき
日本郵便の「はがきデザインキット」で
csvで住所データをエクスポートして
さてexcelで編集しようとしたら・・・ 書式設定で文字列を選べばいいというが、
何度説明しても設定できない人もいるとか
設定するとキモい緑三角マークで挑発してくるとかあるのだよ
あと、ぱっと見で設定が判らない
「'」を入れるは次善策ではあるが、そもそも情報が変化してる
例えば =IF(A1="SEPT1",... というのを
すべて=IF(A1="'SEPT1",... と書き換えなければならない
あと個人的に困るのは大文字小文字が勝手に変わること
といいながら「iPS」と入れたらそのままでちょっと見直した直後、
「CMa」(おおぐま座)と入れたらCmaと変換されて草 >>92
大量なデータの演算処理には、やっぱそうなるんだろうか。
ただExcelという、広く流通しているデータ・フォーマットと
アプリでできることは、なるべく完結させてやりたい。
別のものを付加してまでどれだけメリットがあるか確信ないと。
先ず表計算ソフト(スプレッドシートスタイル)が、これまでも
今後も廃れないだろうことは、入力や出力のデータを数表やグラフ
の形で閲覧できるUIとして普遍的と思われるから、容易に想像可。
そして表計算ソフトのデファクトスタンダードになっているExcelは、
その機能やワークシート関数やマクロの豊かさが功奏して、UIとして
のみならず、演算処理も大概のことができ、つまり完結できるわけで。
ExcelにPythonが搭載されたら、鬼に金棒らしいけど、
具体的にどんなメリットがあるんやら(例えば高速化?)。 そんなことよりもOfficeの「置換」コマンドのショートカットを「Ctrl+R」にする決断をしてほしい Excelこういう余計なお世話機能多いよな。
所詮は事務仕事のオッサンおばちゃん向けのソフトだから。 excelに限らず自動なんちゃら機能はだいたいクソ まだ払ってまでポンコツオフィス使うの止めればいいのでは
無料で互換アプリ一杯あるだろ今は >>15
そういうのは昔はSEDとかAWKとかで前処理したんやで >>100
Excelで作ったデータを他の人と共有するためにCSVで出力したとする。
そのCSVデータをExcelで開くとmarch1のようなデータが日付に替わってしまう。
そこで気づいた人がその部分のセルを文字列に設定すると、その日付はmarch1にはならずわけの分からない数値に替わってしまう。
ずっとXLMだけでデータを受け渡してるならこんなことにはならないのだけど、
多くの人とデータを共有しようとするとこんなことになるんだよ。 ホントに研究者なのか?
エプロンしてんじゃねぇのか? >>1
ばかじゃねーの。
一企業のソフトに合わせる命名規約とか糞すぎ。 だいたい、データがexcelだけで完結する訳ないのよね
作ったデータも元はexcelじゃないし、データを使いたい時はexcelからcsvで出力して別のプログラムに食わせるんだから
excelだけで完結するものと思ってるからセルの書式設定とかの発想が出てくる だからcsvで吐いたデータは安易にエクセルにせず
CASSAVAエディタとか使えっつうのに! >厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
出来るだろ
数値を入れない領域を文字列指定にするだけ
ま、俺は先頭に「'」入れるけど コンピュータの文字列表記って理系の文字表記に関して未だに
物凄く使い勝手が悪いからなあ
Σも∫も上下に添え字を付けられない
化学式も数列もテンソルも添え字を自由に変えられない
Wordでやろうとしたら出来るけど1文字入力に10秒かかる始末
その辺綺麗に書きたかったらLaTeXでも使ってろ!と言われそうだが
まあこれがあるから理系の授業は未だに紙のノートに書くしか無いんだよなあ
タブレット上で手書きで書ければいいけど
(直接サーバーからデータを貰ってこられればそりゃ確かに楽だがw)
コンピュータによるメモは図でも未だに要領が悪い
最終的な仕上がりはグラフィックアプリの方が美しいが
きったなくても良いから本人が分かればいい!というスケッチを
ガガガガッ!と書くならやっぱりまだ手書きが早い 学術記号ばっかりの補助キーボードというのをUSBで付けられるようになったとして
需要はあるかなあ? >>124
キーシーケンスも含めて仕様からしっかりと作り込めるなら学術界の需要はあると思うが、そう考えるならば世界にはとっくにありそうでもあるよね
調べてないから分からんけど エクセルの設定を変えた方が楽なのでは?(^_^;) >>19
てかMSがAppleへ制作してもらってるんだよな
もう買い取ったのかな? 数字の前に上コンマつけるとか(^_^;)
バカかよ >>1
これは良い。Excelの馬鹿のおかげで、遺伝子名を何度手作業で入れ直したことか。 今に、竹島と入力すると別の名前になり、
対馬と入力すると別の名前になり、
などとして、次第に主権が侵されていくんだね。 MS批判されると親でも殺されたかのように激怒するやつって何なのw マイクロソフトのツールは
痒いところを余計に痒くしてくる
気が利かないツールばかりだ >>1
> 勝手に”3月1日”に変換されてしまう現象
Excel の中の人から言わせれば
「勝手に」と言われても…って感じだな
なんでこんな人がExcelを使うんだ?って思うわw >>93
>>80 はそういう指摘じゃないと思うけどw この手の研究者っていうのは、頭が良いのかアホなのか、どっちかわからんな
紙一重とはよく言われるけど、ホントにそういうことなんだろうなって思う >>136
一般的に研究者というのは専門家であり専門領域の研究に時間を割いているわけだから、必然的にそれ以外の事に割く時間が限定される傾向にある
頭の良し悪しではなく、興味があるかどうかも影響するし、専門の研究に直接的に必要でない事、つまり単なる事務処理的な作業に割く時間も気力も無かったとしてもなんの不思議もない
そしてある個人にそのような時間や気力があるかないか、だけではなく、研究者のコミュニティ全体として、そのような事務処理を得意としない人達が一定数いると、情報の交換において今回のような問題が発生するわけ
ツールの設定1つ、ある個人の無能力、とか、そういう単純な話ではないんだよ >>131
むしろ昔の知識で頓珍漢な批判してる奴しかいないだろw
>>132とか >>127
あほ、逆だ。アップルがMSにMultiplanの移植を依頼、その後継がExcel。開発者のチャールズ・シモニーはゼロックスからMSに転職してるが、アップルに在籍したことはない。 =上コンマ&カラム
これでいいんじゃね?(^_^;) 実際この自動変換機能ものすごい邪魔だよな。役に立つこともないし。
なぜデフォルトがオフじゃないんだ 毎度文字列設定にすればいいんだけど
それはそれでウザいんだよね…
デフォルトでは勝手な変換切ってくれれば良いのに マルチプラン懐かしい
5インチFDで貰ったけど用途がわからなかった 原文では
csvデータが使いづらい、って話だろ
アポストロフィや書式設定の話をしてるのは
まったく話を勘違いしてるとしか思えん 俺は素人だが表計算ソフトで数値以外を扱うのは限界なんだろう
プログラミング言語だと変数とかを使うときに
明確にどういう変数か宣言?させるのもあるんだっけ?
だから、数値以外のデータを扱う場合は、そういうソフトや
フォーマット等の、それなりの仕組みが必要であって
Excelにそのまま全部押し付けるのは無理があると思う 直接データベースにぶち込めばいいんじゃねーの?
なんでExcel使うんだ? >>18
いや、お前こそ実際に自分で試してないだろ?w
移動やコピーしたって変わりゃしないよw ある文字列を含むセルを検索させて、
区別して標示する機能(たとえば色を変えて標示するとか
ブリンクさせる)なども、ないんじゃないのか?
Wordも i と書きたいのに勝手に I にする馬鹿たれだし。 Excelは表計算ソフトだから使う方が間違ってる
csvファイルならCSVエディタあるからそれ使え 去年はタピオカドリンクもブームだったし
タピオカの原料のキャッサバの名を冠した
Cassava Editorをやっぱり補助で入れたいね >>1
シングルクォーテーション付けたら付けたで、別のデータに使い回すのが面倒 >>1
シングルクォーテーション付けたら付けたで、別のデータに使い回すのが面倒 >>13
そういうくだらないことに時間かけることに嫌気がさすんだよ。 科学者らがエクセルで日付化けで?
おいおい大丈夫か?プログラム組んでテキストで編集すれば良いだろ。
バッチも作れないのかよ。 >>157
自然科学をやる人でPC上のプログラミングが出来る人の比率は8割には絶対達しない
特に日本の学位持ちはプログラミングが出来る人の比率が低い マイクロソフトの息がかかった研究者や企業はこういうのに対応したエクセルを使ってそう
市場独占とはそういうもの >>157
馬鹿丸出し
プログラム組む必要がある段階で既におかしいって話だから
スクリプトキディは世の中について勉強してからレスした方がいいぞ python勉強してopenpyxlで操作した方がマシか excelでもwordでも勝手に変換するなよ!ていつも思う >>157
できる出来ないではなくて面倒
どんな環境でも余計なことしなくても問題が発生しない方がいい >>159
そんなアホなことする前にCSVを直接処理するシステム組んでるだろw
最悪アドインでなんとでもなる話だし オフィス仕事してる奴はOfficeに詳しくやたら使いこなすだろが
この手の先端にいる奴ほど疎いもんではないかいな。 遺伝子名を入力する可能性がある世界中のすべての研究者に正しいExcelの使い方を周知するよりは、
遺伝子名を変えちゃったほうが楽なんだろうね excelの問題はいきなり仕様変更する事
細かい目立たない所でいつの間にか >>1
不便利機能満載の米国製ソフトを
金科玉条にして追いかけるだけの日本企業
現状に首を傾げ「正しいイノベーション」をもたらすのは
日本以外のアジア企業だろうな >>厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。
勝手に略称を作って問題を起こしていながらずいぶんな物言いだな。 >>10 >>18
セルの書式設定(セル書式設定窓)ではなく
セルのスタイルの編集(スタイル窓)ならできるけどね
アイコンは何処にあるかな?
┐(´∀`)┌ やれやれ >>175
エクセルは汎用ソフトつまりアプリケーションソフトウェア
にイチャモン付ける方が間違いで運用でカバーするしかない
用途に合わないなら専用ソフトを購入するしかないんだよ >>176
多くの論文で実際に問題が発生してるから名称を変えましたってのが事実で
それ以外は記者の駄文 >>177
論文を記述するならエクセルじゃないでしょう
まあワードにしても使い物に成らないのは確かだけどね
文句があれば昔のように紙に書けば良い >>178
お前が何も分かってないことはよく分かった ■ このスレッドは過去ログ倉庫に格納されています