実験データを正しく扱うために 
化学同人編集部編

「君子豹変 するかも意味は下の*のと ころにサイト



前田耕治, 山本雅博,加納健司

Update   2024/April/10   あなたは、 カウンター人めのお客さんです。
takusama
(作:加納琢司様)考える: はかる、処理、グラフ化といった意味合いを含んだ絵だそうです。
それにブラックユーモアとして、数字の魔術師、ロバート・マクナマラ(ベトナム戦争の統計と捏造)をイメージしたものとのこと 
greenISBN
Version tracking: 2007 12/20 第1版第1刷発行:  2008/2 第2刷(一部加筆改訂を含む) 2009/2月 第3刷(一部加筆改訂を含む): 2010 3/1 第4刷(一部加筆改訂を含む:以下参照): 2011/3/1 第5刷(一部加筆改訂を含む:以下参照): 2012/2月 第6刷(一部加筆改訂を含む:以下参照): 2013/2月 第7刷(一部加筆改訂を含む:以下参照): 2013/9月 第8刷(一部加筆改訂を含む:以下参照): 2015/2 月 第9刷(一部加筆改訂を含む:以下参照):2015年9月 第10刷: 2016年3月 第11刷: 2016年9月 第12刷: 2018年2月 第13刷: 2018年9月20日第14刷: 2019/3/1 第15刷: 2019/9/20 第16刷: 2021/2/10 第17刷: 2022/2/10 第18刷 :2022/9/10 第19刷


いつの日かベイズ統計学にもとづいた本を出したいとおもっております。(2022 Oct 8) いつになるかわかりませんが...(MY)



本の俯瞰図mindmap(PDF)

本書は例えば以下のようなことを知りたい人に最適かもしれません。

 ・ (再現性の根拠となる)エラーバーはどのように求めるのか? Studentの 分布? Studentって???
 ・ 吸光度測定において吸光度A が0.2-0.8の範囲で測定しないといけない訳
 ・ 物理量の単位と次元
 ・ 濃度の換算
 ・ 平衡定数は単位をもつのか?
 ・ 有効桁・有効数字を定量的にきっちり求める方法は?
 ・ 実験は,3−5回以上繰り返せといわれるが理由はあるの?
 ・ 希薄溶液の調製の際,多段希釈をおこなう理由?定量的に!
 ・ 食堂の大ライスの盛り付けがいつも少ないとクレームをつけるには?
 ・ 気に入らないデータは,勝手に捨てていいの?
 ・ 「!重み付き!」の最小自乗法を用いないと,計算の段階で5%以上の誤差を生み出してしまう。
   せっかく苦労してとったデータが意味をなさなくなる!?
 ・ 対数プロットでは,エラーバーは上下非対称でもいい!
 ・ グラフの書き方って?



本の「まえがき」の一部
 学生諸氏にとっては、「実験データを解析し、レポートにまとめるまでが実験である。」と口酸っぱく言われながらも、いざレポートを書くときには、単位、 有 効数字、誤差、異常値の処理、回帰計算、グラフの書き方など、実験データの取り扱いについて、自己流あるいは曖昧な表現で提出してしまい、厳格な教員に青 筋立てて怒られたり、添削で真っ赤になって返却されたりすることがしばしばであろう。こんなとき、上記のような内容が一冊の本にまとまっていれば、学生あ るいは実験の初心者にはどんなに便利であろうか。そのような思いから本書は企画され、また、関連分野の先生方からも発行を勧められた。
 いざ書き始めると、統計解析の分野は広く深く、また、データ解析のためのコンピュータとアプリケーションの進展も著しいことに気付き、どこまで書くべき か についての議論が尽きなかった。しかし、初志を忘れず、実験とは何か、数値データとは何かを根本から解き起こし、読者を統計解析の入り口まで導くことに専 念した。公式集にならないよう、必要にしてかつ十分な数式をあえて載せた。学部学生のみならず、研究に携わる卒論生・大学院生・研究者にとっても、机上に 常備していただける一冊になれば、幸いである。 ・・・ (M)

本の「あとがき
 いくつもの事象が幾重にも複雑に織りなす自然や社会。彼らは,暖かく,厳しく,時には残酷に私たちを包んでいる.しかし,彼らは自らの本質についてなか なか語ろうとはしない。
 実験,観測,あるいは調査という行為で,我々は自然に対して問いかけようとする.真摯な態度で対峙すれば,自然は我々に,求めている答えに関する ヒントを授ける.不誠実な態度で接したら,当然の報いとして,ヒントはベールに包まれてしまう.一回の問いかけで返されるヒントにも重要なメッセージは隠 されているが,我々にはそれを解釈も判断もできない.三顧の礼を尽くすように,時にはお百度参りのように,何度も問いかけ続け,それで授かったヒントを統 合すると本質に近い姿が見えてくる.
 科学関連学生のための統計に関する教科書の執筆をMがYに持ちかけた.昨今の捏造関連報道やデータの取扱方に心を痛める?YはMの申し出を断る理由がみ つからない.Kも引き込み執筆を引き受けた.簡単そうで奥深く,難しそうでわかりやすい本を目指して!
 MとYは関連書物を行間まで読み抜き,時には原著までさかのぼり,独自の新しい表現を模索した.深夜になるとメールが飛び交った.休日には3人集 まり,時には熱い議論を交わし,そして時には長い沈黙が続いた.一山越えたとき(実際には越えていないことが多い!?),手にもったグラスがさっと飲み干 される.席を外したKは七輪で火をおこし,何やら焼き始めた.いつしかみんな集まって宴会に.会話は統計と○○の話.たそがれも過ぎ,暗闇の中で炭火だけ が映える.結局,今日はどこまで進んだの? 翌朝一番に,昨晩の七輪談義についての新しい見解がメールに乗ってやってきた.
 そんなことを続ける間に,この長いトンネルにも,一条の光がさすようになった.トンネルを貫けたら,誰かが待っている!? それが真摯な態度で自然に問いかけようとする人であったらこの上もない喜びである.(K)


本の内容の一部はこちらから御覧になれます。⇒ 化 学同人「データを正しく扱うために」のサイト





出版後の訂正・コメント・対話 (テーマ毎に水平線が入ってます。)

* 君子豹変す『易 経』)と いう言葉がある。ころころと態度を変えるという悪い意味で使 わるが、本来は違う。「小人(しょうじん)は面(おもて)を革(あらた)む」と続く言葉に対するものである。「間違いに気づいたときに,小人も“変われる”がそ れは「表面的なもの」にとどまる。が,きちんとした人間は直ちに間違いを認めて,意見を変え自分自身を向上することができる。
垣内先生もポーラロ誌の編集後記で書いておられますが、 花井哲也氏「膜とイオン」の前書きに ”筆者はかつて先輩,恩師から「本を書くことは,恥をかくことだ」と諭されたものである。” という一文があります。 本はいろんな読者に読まれ批判されます。やはり怖いものです。 しかし,間違いはすぐに訂正ということで,「君子豹変す」を立ち上げました。 恥もかくけども、それ以上に読者とのやりとりで勉強になるということが 重要だと思いまして。




九州大医田代洋行先生より新SI単位系の記述が緑本にないことをご指摘頂きました。
また,以下の6つの講習テキストのご利用も希望くださいました。ありがとうございます。
新SI単位系については,緑本に加筆訂正して行く予定ですが,とりあえずはここに書いた文章をご参照ください。
新SI単位系について (PDF 19 pages)

甲南大村上良先生より以下のご指摘をいただきました。(私も学生さんに指摘されて気が付きました。 授業の際に最前列付近に座っていた女の子のグループです。図書券がもらえるかも!と伝えておきました。)次の増刷りで修正します。
p.7にミスプリがあると思います。
【誤】1 mgを1000 μkgとは書かない。
【正】1 mgを1 μkgとは書かない。
ご確認していただけると幸いです。

以下の6つの講習会用PDFファイルにははPasswdがかかっております。
著者(M.Y.)にPasswdをリクエストください。2018/August/16
テキストその1 (PDF 38 pages)
問題解答その1 (PDF 17 pages)
テキストその2 (PDF 28 pages)
問題解答その2 (PDF 7 Pages)
テキストその3 (PDF 51 pages)
問題解答その3 (PDF 21 pages)


京大農学部応用生命(加納先生のお膝元)で,山本(甲南大理工)が統計解析学という名前で3年間(2017, 2018, 2019)講義致しました。 1年目の学生さんである井上貴斗さんとは意気投合しました。彼は小針さんの本を買って,その間違いも直してくださり,講義後の夏休みに送ってくださいました。 当方の教育者?(大学2年の教養の試験で量子力学の試験完全白紙なのに,量子化学の本書いたりしている!)としての宝です。ご覧下されば幸いです。
井上君はその後,極めてユニークな実験を行い,独自の統計学を展開されていると加納先生からお聞きしております。すごいすね! 京大応用生命井上君からのレポート

下記にも書きました以下の質問ですが,関連HPをリンク致します。2017/05/24
Q 垣内隆先生より: 実験でxもyもエラーバーあるデータありますよね。重み付き最小二乗法はどの様に解くんでしょうか?
以下の産総研のHPに詳しい答えがございます。
産業技術総合研究所 計測標準部門 計量標準システム科 主任研究員 井原俊英氏と 先端材料科 材料評価研究室 テクニカルスタッフ 新 重光氏が保守管理する「化学標準物質の不確かさ」に関するページ
Demingの方法による重み付き回帰分析.pdf
Deming法重み付き回帰分析プログラム
粟屋(あわや)氏の方法もここで取り入れられてます。

粟屋氏の本(粟屋 隆「データ解析 : アナログとディジタル」 (学会出版センター))で,書かれたFORTRAN codeは著者と コンタクト致しまして公開の御許可を得る予定です。

佐藤郁朗氏の気合いのあるサイトでも「粟屋の方法」を解説されております。
「粟屋の方法について」 佐藤郁朗氏
「楕円近似について(その5)」 佐藤郁朗氏

Nature digest記事:Monya Baker,p値の誤用の蔓延に米国統計学会が警告 - pp12 - 13
科学者によるp値の誤用を止めるため、米国統計学会(ASA)が異例の声明を出した。
doi:10.1038/ndigest.2016.160612

(MY解説) 困ったときのp値詣だそうで。。。極端には,p値が5%以下になる分布や統計ソフトを探すという本末転倒まであるそうです。ようするに,本来グレーなものを 白というには無理があるのでは?と考えないとね。
今,主張したい仮説があるとする。検定では,その仮説(対立仮説)を検定するのではなく,否定したい仮説(帰無仮説)が統計的にありえないことで棄却されることを利用する。
p値が有意水準(例えば5%)よりも小さければ,帰無仮説は棄却される。

例:ある母集団の平均値<x>と分散σ^2が与えられる。サンプル数が多ければ平均値の分布は中心極限定理より正規分布と見なせる。 サンプル数100の平均値が母集団のとは少々ずれているとする。そのサンプルの平均<x1>は母集団のとは5%の有意水準で差があるといえるのか? 帰無仮説:有意差がないすなわち母集団の分布内にとどまっている。両側検定,その正規分布から,<x>+|<x1>−<x>| 以上および<x>ー|<x1>−<x>| 以下となる確率を(<x>,σ)をもつ正規分布から求める(数値計算あるいは数表から)。その確率は0.03 = 3%だとする。p値が3%で有意水準5%より小さく, 帰無仮説(母集団の分布内にはとどまっていない)は棄却される。ただし,以下のようなユルユル,ガチガチで間違いを犯すこともあることに注意すべきである。 信頼度68.3%, 90%で帰無仮説を棄却した:ユルユル, 信頼度95%では帰無仮説が棄却できるのに信頼度99%にして棄却しなかった:ガチガチ

関連して阪大理・諏訪先生・「ぶんせき」2017年3月号談話室「統計リテラシー」のPDFをご覧下さい

甲南大のN先生よりさらにご指摘いただきました(2016 May 27)
p.102 例題9.3の値が先生の計算と微妙に!一致しない。
 以下の2つのPDFファイルにございますように,「重みあり」および「なし」とも  値が少々間違っておりました。
 また,A±δA, B±δBは
 式,GNUPLOT, Igorのすべてで値が一致しておりました。
 (教科書のここの部分も要訂正です。2007年からソフトの方のバグが  正されたのかなっと!言い訳します。)
また,規格化した重み(9.7)式を使った表計算で,重みは(9.12)-(9.16), (9.17), (9.18)で用いても 同じ結果となりました。以下のPDFをご覧下さい。
P.94-95, P.102は書き換える必要がありますね。  第12刷で訂正いたします。  いろいろ検討くださいまして,心より御礼申し上げます。

例題9.3 重み付き最小二乗法:PDFをご覧下さい(MY)
例題9.3 重みなし最小二乗法: PDFをご覧下さい(MY)


甲南大のN先生よりご指摘いただきました(2016 May 18) p.93 「指数関数の引数-χ^2 / 2」はまちがいではないか?
第12刷りで以下のように訂正します。「指数関数の引数の大きさ χ^2 / 2」

当方の所属の間違い: 機能分子工学科 → 機能分子化学科

§ %と℃ について : 単位記号として扱われるという考え方を採用しているので,数字との間に「半角スペース」をいれること。
第11刷りで修正予定(2015/8/12)


§ 阪大のSuw*先生から以下の質問がありました。(2014. Sep)

x、yという量を同時に測定します。両方の測定値には正規分布の誤差があるとします。
(x/y)_meanを一回ごとの測定値を割算したもの(x/y)の平均値とすると、測定回数を無限大に大きくしても、(x/y)_meanは (x/y)の真値とずれますでしょうか?
x=1、y=1、両方の標準偏差を0.03とした場合について、10^6回の平均値をLabVIEWでシミュレーションしてみたのですが、 (x/y)_meanは1.001程度となります。ま、標準偏差とともに1からのずれは大きくなりました。 (標準偏差の2乗に比例?)シミュレーションの結果は使用した乱数のせいなのかもしれませんが、誤差のある測定値同士の割算ってあまり良くないのでしょうか??

結構悩みましたが,答えはこうかなと! PDFをご覧下さい(MY)


§ 第9刷で加筆予定

ご採用頂いてる先生からご指摘ございました以下の点修正いたしました。 p.9 cm s-1はcm2 s-1 p.59 Gaussain はGaussian に。


2014/7/3
Q 垣内隆先生より 良く実験でxもyもエラーバーあるデータありますよね。あのときの,重み付き最小二乗法はどの様に解くんでしょうか?
A これも垣内先生より Demingの方法があるようです。(Deming, W. Edwards (1964) [1943]. Statistical Adjustment of Data. Dover. ISBN 0-486-64685-8.) 詳しいことは以後報告します。
xにもyにもエラーバーあるデータに対する重み付き最小二乗法にはDemingの方法あるいは粟屋の方法がある。 詳しくは,粟屋 隆「データ解析 : アナログとディジタル」 (学会出版センター) 参照のこと。


2014/7/7
教科書 p.94 (9.21)式の前後
すべての重みwiを1とおいてまずA, Bの値ををもとめる。A, Bの値は重みがすべて同じであれば,その大きさに依存しない。
ただし,δA, δBは(等しい)重みの大きさに依存するので(9.21)式を用いて仮のエラーバーの大きさを求め,全てのδyiをその値にして再びδA, δBを求める。

(2013/9/3)
p.87  以下の段落を追加しました。 8.7.4 検出限界と定量下限
検出限界は,ブランク信号との比較において,測定された数値が分析信号としての意味があるかどうかを表す半定量的な限界値である。 検出限界は定量しうる真値の限界を表しているわけではない。この値を上回ったからといってすぐさま分析値としてはいけない。
 分析値として定量しうる最低量としては、定量下限を用いる。この限界値はブランク値の確率分布から決められるのではなく, 一般に大きい測定値ほど相対標準偏差(RSD)が小さくなり,信頼性が高くなることに由来する。例えば、RSD10%以上が基準になれば,標準偏差の10倍が定量下限となる。 定量下限は、その分析に要求される精度の度合いによって変わる。実用的には,精度の基準として,ブランク値の標準偏差ではなく,測定値の標準偏差を用いる場合も多い。
環境行政レベルでは,環境基準として示される「検出されないこと(not detected)」は「《ある決められた方法で》 定量限界(定量下限)以下であること」と決められている。分析法の進歩とともに定量下限が下がった場合には, これまで検出されなかったレベルが検出されてしまうことに注意すべきである。



§ 第8刷 p.13 訂正
体積分率の定義のところで,
IUPACでは、ある成分の体積を混合前の成分の体積の和で 割ったものと定義され、混合溶媒の調製に使われる。一方で、 醸造酒のアルコール濃度や大気汚染物質の濃度など、混合前体積が はかれない場合は、混合物の体積1cm3に占める成分の体積(cm3)で 示されることもある。

p.11 加筆 
国際純正・応用化学連合(IUPAC)の前に「国際標準としての地位を確立している」を挿入。


§ 第7刷 p.13 訂正

緑本で質問が学生さんからありまして。。
「体積分率」のところです。
緑本には,試料1cm^3に含まれる成分の体積と書いてありますが
試料の体積というのは通常混合後のものを想定しますよね。

IUPACの定義では,混合前の体積をV_1, V_2, V_3として
n番目の成分の体積分率はV_n / Σi V_i
と定義しています。

誤解を招く表現なので次の刷り(8刷)で訂正します。

MK先生よりコメント

曖昧なまま残している部分でした。今のままでは
よくないのは確かです。
黄色本でもK親分と議論になり、両論的な
表現になりました。

混合溶媒中のアルコール濃度は、IUPAC定義のとおり、
混合前の体積が分母です。実際そのように作ります。
講義でも私はこちらで教えています。

しかし、お酒中のアルコール濃度などは、
ワイン、ビールは混合前体積など不明です。
あれは「酒精度」 として%で表され、
その定義は「混合液100容積から得られる純アルコールの容積」
が普通です。ということで、K親分は全面的に
IUPAC支持とはならなかった。

なるほど。。。(MY)

KK先生より  深いんですね・・・

日本薬局方のアルコール濃度も混合後だったような・・・


§ 月刊「化学」誌に3人で12回シリーズの記事を書きました。イラストが本当にすばらしく,時には作者が自分の原稿を読んでゲラゲラ笑いました。楽しい連載でした。

BT 化学いまさら問答(1) 「平衡」に閉口!?  ●加納健司・前田耕治・山本雅博 月刊化学 2011年9月号 Vol.66 No.9 pp. 54-55
BT化学いまさら問答(2) 単位の弾き語り ビブン・セキブンいい気分♪ ●前田耕治・加納健司・山本雅博 月刊化学 2011年10月号 Vol.66 No.10 pp. 44-45
BT化学いまさら問答(3) 化学のなかのジキルとハイド 水に流せぬH2O ●前田耕治・加納健司・山本雅博 月刊化学 2011年11月号 Vol.66 No.11 pp. 62-63
BT化学いまさら問答(4) タンカーは1円玉で動く? ●山本雅博・前田耕治・加納健司 月刊化学 2011年12月号 Vol.66 No.12 pp. 56-58
BT化学いまさら問答 (5) 誤差伝播 「パン」ではなくて「パ」でんねん (それがブラウン運動とどないやちゅうねん)●山本雅博・前田耕治・加納健司 月刊化学 2012年1月号 Vol.67 No.1 pp. 56-58
BT化学いまさら問答 (6) すべてがFによる We love Michael Faraday ●山本雅博・前田耕治・加納健司 月刊化学 2012年2月号 Vol.67 No.2 pp. 30-32
BT化学いまさら問答 (7)宇宙人っている のいないの? 推定と検定はどう違う? 月刊化学 2012年3月号 Vol.67 No.3 40-43.
BT化学いまさら問答 (8)平衡とエントロピー 入り乱れが大好き!? ●加納健司,山本雅博,前田耕治 月刊化学 2012年4月号 Vol.67 No.4 62-65
BT化学いまさら問答 (9))実は誰もわかってないかもしれない簡単化学: Quantum Chemistry ●山本雅博・前田耕治・加納健司 月刊化学 2012年5月号 Vol.67 No.5 42-45
BT化学いまさら問答 (10)Jumpin' Jack Flash! 跳ね上がり分子だけが明日を見られるか?●山本雅博・前田耕治・加納健司 月刊化学 2012年6月号 Vol.67 No.6 48-51
BT化学いまさら問答 (11)山鉾巡る,単位も巡る ついに消えるか?最後の原器 ●前田耕治・加納健司・ 山本雅博・ 月刊化学 2012年7月号 Vol.67 No.7 48-50
BT化学いまさら問答 (12)天国(平衡) と現実(速度) 二つをつなぐ虹の架け橋:Stairway to Heaven●加納健司・山本雅博・前田耕治 月刊化学 2012年8月号 Vol.67 No.8 45-48.

化学同人さんのご厚意により,上記BT全シリーズに更に加筆したものを,電子ブックでお届けします。近い将来?の予定です。2012 Dec. 29 MY記

§(第7刷で修正します。)
p.16 37w/w%HClを0.1 mol dm-3 100cm^3 作る計算式で, (2.4),(2.5)はいいんですが, 100 x 36.47 x 1.0 x 100 / 10 / 37 = 9.9 g と書いてあります。 9.9 gは正解だと思うんですが, 左辺は素直に計算すると,985 gとなります。 最初の100がいりませんので修正ください。

最近の学生は全く計算できないといってますが
書いてる我々が間違ってました。おわびします。

次の刷りで, 公式書くのではなく もうちょっとわかりやすく w/w%, mol dm-3の定義とかからはじめて その都度計算して行く方式に 書き直します。
2.6.4節訂正・加筆pdfへ(第7刷で訂正・加筆します。2012.Dec.29)



§(第6刷で修正しました。)
p.14-15: 「重量モル濃度」はすべて「質量モル濃度」に修正ください。
p.16: Mを分子量としていますが,モル質量(定数)に修正ください。
p.17: 表2.8 「化学式(M)」を「化学式(分子量)」に修正ください。


§ 月刊「化学」誌に BT(ぼけとつっこみ)化学いまさら問答(あなたの知識本当に正しい?)12回シリーズ連載開始しました。2011 Sep.-2012 Aug.の予定です。
第一回は,”「平衡」に閉口”です。

§ 月刊化学 2010年10月号 Vol.65 No.10 pp. 35-39
に「その実験データ解析,ちょっとどーなん?!」
という記事を掲載いただきました。
kagaku

§ ---------- 誤差伝播 10年7月2日---------------
Question: 加減乗除と対数についての誤差処理は理解できましたが、平方根を取るとき や三角関数についてはどう考えるのか、手ほどきをお願いします。  つまり、(例) (12.5 ± 0.3)を平方に開くと、このときの誤差はどうなり ますか。この数値のsinはどの程度の誤差を伴いますか。

Answer1
平方根のときは、誤差が無限小のとき、 誤差δyは±(微分係数×δx)ですので、 (12.5 ± 0.3)^(1/2) のδy は  1/2×12.5^(-1/2)×0.3 = 0.042 ということで、3.54±0.04 の答えは 実際の3.49〜3.58とほぼ一致し、悪くないですが、 ただし、9章の扱いのように厳密にプラスとマイナスの誤差を分けて 考えるときは、式としてはどうなるのでしょう?

三角関数のような周期関数では、極値に近いと 正負の誤差がかなりずれます。 y =sin (12.5±0.3) のときは、 δy = cos 12.5 ×0.3 = 0.30 で、 答えは、-0.07±0.30となり、まあまあよし。 しかし、sin (13.8±0.3) のときは、 機械的にやると、0.944±0.099などとなってしまい、 1を超えるのは問題外としても、 実際のyの範囲、0.804〜0.999とはかなり異なります。 この場合も、プラスとマイナスに別々の表現が必要?

Answer2
(x + δx) ^(1/2) = X + δX とおく
両辺を二乗します。
x + δx = X^2 + 2XδX + (δX)^2

X = x^(1/2)
(δX)^2 + 2X δX = δx
2次方程式をといて
δX = (1/2)[-2X ± (4X^2 + 4 δx)^(1/2)]
= (1/2)[-2x^(1/2) ± (4x + 4 δx)^(1/2)]
正の解をとる。

(x - δx) ^(1/2) = Y - δY とおく
両辺を二乗します。
x - δx = Y^2 - 2YδY + (δY)^2
Y = x^(1/2)
(δY)^2 - 2YδY = -δx
2次方程式をといて
δY = (1/2)[ 2Y ± (4Y^2 - 4δx)^(1/2)]
= (1/2)[ 2x^(1/2) ± (4x - 4δx)^(1/2)]
正の解をとる。


三角関数はちと変な答えになりますが,以下のようになりますかね。

三角関数はexp(ix) = cos(x) + i sin(x)をつかうのが便利ですので
sin(x ± δx) = Im exp[i(x ± δx) ]となります。Imは虚数部をとるという意味です。
sin(x ± δx) = Im exp[i(x ± δx) ] = Im exp(ix)exp(±iδx) = Im [cos(x)+i sin(x)][cos(δx)± i sin(δx) ]
= sin(x)cos(δx) ± cos(x)sin(δx)
δx が小さければ,cos(δx) = 1 - (δx)^2 /2 =1, sin(δx) = δx
となってAnswer1の答えと同じになります。

δxが周期関数の周期よりも小さくない(大きいとき)には,sin(x ± δx)は
物理的に意味がなくなると思います。

Answer3
上の解答間違いですね。ごめんなさい。

sin(x ± δx) は,
x - δx から x+δx の間でのsin の最大値を f_max
x - δx から x+δx のsin の最小値を f_min
とすると
プラス側は  f_max - sin(x) (>=0)
マイナス側は f_min - sin(x)  (< = 0)
とするのが正解のような。

更に補足
ISBN ISBN
x0 ± δx という測定値と誤差があって
その関数f(x)の f(x0)からのずれ±δfをみる。
数学の言葉でなんていうのかよくわかりませんが,
一価で連続で単調増加(単調減少)の性質の良い関数(例えばlnx)では,
1) δxが小さいときは誤差伝播の式を使える。
2) δxが大きい場合は,+δf = f(x - δx) - f(x) , f(x + δx) - f(x) のどちらか正の方
           ーδf = f(x - δx) - f(x) , f(x + δx) - f(x) のどちらか負の方

sin(x)とかx^2 とかの場合は,かならずしも単調増加・減少でないので(山あり谷あり)
x0 ± δx の間にあるf(x)の最大値と最小値で±δfが決まる
と考えました。



§ ---------- エラーバーの非対称性について 10年4月7日---------------
K大のN先生より以下のご指摘をいただきました。

エラーバーの長さが上下で偏るはなしがよくわかりません
誤差伝播の式からエラー出すと、上下で偏らず均等になるはず、
でも、誤差を含めて式変形すると、偏る、
どっちがいいのでしょうか??

対数とかに変換した場合かと思いますが,
誤差伝播はdxが小さい場合です。
あるデータが x± dx のデータで得られたとして
(例えばUV-VISの場合測定しているは透過率なので)
その対数(吸光度)をとると ln (x± dx) = ln x(1± dx/x) = ln x + ln ( 1 ± dx/x )
極端な dx / x = 1 の場合
ln x + ln2,  ln x − ln(0) (-\infty)
となりましてエラーバーが上下非対称になります。

誤差伝播の場合は,dx / x << 1 なので
ln x + ln ( 1 ± dx/x ) \simeq ln x ± dx/x
[ (ln(1+x)のTaylor展開の1次の項までで] となり,対称となります。 dx/x << 1 の近似が使えるかどうかで判断しましょう。


§ ---------- ガラス測容器の膨張について 09年8月26日---------------
ガラス測容器の膨張係数が大きすぎるとのご指摘を頂きました。

教科書では体膨張係数として2.5x10^-5 K^-1 の値を使っております。
柴田科学のHPとかをみますと、ガラス測用器に使用しているガラスの 線膨張係数は3.3x10^-6 〜 4.9x10^-6 となってます。
3倍して体膨張係数に直すと、1〜1.5x10^-5となりますので、2.5x10^-5は そんなに大きな数字ではないようです。
ガラス膨張の(4.3)式は、水膨張の(4.2式)に比べれば、 ほとんど無視できると一言、書き添えるべきでした。
次の改訂のときにでも。

追加コメント:今やガラスの材質がいいので,測容器を乾燥機にいれても問題ないそうです。要チェック!
§ ---------- 2009年6月8日 分析化学会近畿支部基礎分析講習会の報告です 発表スライドも掲載しました。---------------
以下のPDF(87ページ)を参照ください。
分析化学会近畿支部基礎分析講習会の報告
↑貴重なお宝があるかも!?
第1部 セルフチェックテスト:濃度の計算、有効数字、秤 量・溶液調製・体積計の選択などの実験操作、直線回帰のグラフ、 エラーバー、t検定(前田)
第2部 実験操作に関する解説:秤量と溶液調製の重要性と、誤差の伝播の怖さ(加納)
第3部 データ棄却の方法(Q-test),再現性の指標となるエラーバーの 書き方,最小二乗法の計算方法を具体的に示した。エラーバー は,Studentのt分布を考慮して求める事が重要である ことをのべた。また,最小二乗法の計算の実際においては,エクセ ルでは,傾き,切片の誤差の評価ができないこと,重みをつけた最 小二乗法ができないことを述べた。(フリーのソフトである GNUPLOTをもちいれば上記の問題は解決する。)重みをつけた(すな わち誤差の大きいデータは重要視しない)最小二乗法をもちいないと10% に近い誤差がフィティングにより生じてしまうことを述べた。モル 吸光係数を求める際の,最小二乗法について,吸光度で直線回帰す るよりは,透過度で非線形の最小二乗法を使ってモル吸光係数を見 積もる法が誤差は少ないことをGNUPLOTを用いた計算で示し た。ソフトの説明に時間をさけなかったので,わかりにくかったとのアンケートを頂いた。 当日配布した資料や以下のサイトhttp://t16web.lanl.gov/Kawano/gnuplot/index.html を参考にして頂きたい。(山本)


§ --------------- 第3刷(2009/5月) p45-p46 誤植多し。後述の誤差伝播の式(7.2.6で詳述)でも使っているので、 誤差伝播の式を使わずに全面的に書き換えました。
以下のPDFを参照ください。
δpHとδ[H+]の関係


§ --------------- 第3刷(2009/2月) 誤植です。御訂正くださいますとありがたく存じます。---------------

p.58 欄外のfootnoteのところの下から二行目
 "u^2 / EMBED equaiton 3は変動係数(coefficient of variance; CV)とよばれ"
 を
 "u / \bar{x}は変動係数(coefficient of variance; CV)とよばれ"
 に変更下さい。
   (ちなみに,uはイタリックで標準偏差のこと,\bar{x}はx(イタリック)の上にバーで
  平均値を表します。)


§ --------------- 池澤夏樹「叡智の断片」p46 集英社 2007 ---------------

・There are three kinds of lies; lies, damned lies and statics.
Benjamin Disraeli

・It is much easier to make measurements than to know exactly what you are measuring.
J. W. N. Sullivan

§ -------非線形最小二乗回帰における初期値問題--------09/03/15
ある先生が,以前某雑誌に投稿した時に,非線形最小二乗回帰で あるパラメータをだしたところ refreeからその回帰の計算結果は残差のローカルミニマムであり もっと残差がすくないグローバルミニマムがあるはずだとの指摘をうけたとのこと。 初期値依存性をチェックしてなかったためにやってしまったと言ってはりました。

あるソフトでは、非線形回帰でフィットする初期値パラメータを自動でわりふるためだったようですが、 我々が本で示したようにこのようなことが十分起こりえます。出版される前に気づいてよかったんですが、 最悪の場合業界を去らないといけない事態にもなります。明日はわが身。(MY)

§ 小林-益川理論の検証実験:KEK B-factory(Belle) vs SLAC(BaBar)
 B0中間子とその反粒子で観測される崩壊確率のずれの大きさでCP(charge conjugation symmetry and parity symmetry) violationが検証できるらしい!??。「CPの破れ」を計算したとき,求められた中心値(下図の丸印:平均値のこと?)に対して,誤差の幅(下図のエラー バー)が中心値の1/3以下になると,「CPの破れがその中心値になる確率」は99%以上となる。したがって,「CPの破れを99%の確率で発見した」と いうには,中心値がゼロでなく誤差がその中心値の1/3でなくてはならない。この検証レースに,米国スタンフォードのSLACはKEK(高エネ研KEK) よりつねに先行していたが,上の条件を満たしていなかったために「発見」には至らなかった(2000年7月)。その後,KEKの装置の改良が功をそうし て,ほぼ同時に上の条件を満たし「発見」となったようである。(2001年7月「発見発表」,最終確定2002年7月)
 ベストデータだけで議論することなく,誤差が確定するまでは発見にはならないという素粒子実験家のFairな「姿勢」を見習いたいですね。特に、ベストデータだけで堂々と「発見!」といっておられる一部業界の方には耳の痛い話ですね。(MY)

CPviolation
以上 日経サイエンス2009年3月号 pp.92-107 「巨大加速器実験,日米の闘い」より


§ --------------定義追加------------------08/10/22
赤池情報量基準:AIC (Akaike's information criterion)

Fitする関数のパラメータを増やしていけば(例えば,多項式fitの場合,項の数がパラメータの数になる。) ,通常はデータとよく一致するようになるが パラメータの数がどの値の時にベストであるかを残差だけから見極めることは容易ではない。 (例えば,緩和現象を記述するのに,1つあるいは2つの指数関数で近似する場合があるが どちらでもいい!ように見えることが多いですね。) 目で見て判断するといういい加減な基準でいいとさえ思ったりする。
赤池弘次氏は以下のAICが最小値を持つ時にモデルが最適であることを示した。

AIC = -2 ln[最大尤度(ゆうど)] + 2*パラメータの数

モデルとして最小二乗法を使うときには,

AIC = n*ln(S)+2*(m+1) ここで,nはデータ数,Sは残差二乗和(教科書でのχ二乗に相当する),mはパラメータの数である。

多項式でのfitとAICの関係が,中川-小柳「最小二乗法による実験データ解析:プログラムSALS」のpp.153-155に例として示されており, AICの最小が最適なfitであることを示している。


★将来予測に欠かせぬ尺度/赤池情報量規準  (aspara 科学面にようこそ)米山正寛081006朝日新聞 [現場から積み上げた数学(統計学)というのが面白いですね!」
朝 日新聞記事の引用サイトへ   朝日新聞記事のpdfへ

東 洋大学 吉野隆先生によるAICの解説へ
  
AICに関しては何冊か目を通したが、吉野先生のサイトでも紹介されている
坂本慶行,石黒真木夫,北川源四郎,情報量統計学,共立出版,1983
の本が最もわかりやすい。(と、詳しく読んでもいないのに言っていいのか?)(MY)

§ --------------定義追加------------------08/10/20

変動係数:coefficient of variance = u / \bar{x}

ここで,uは不偏分散,\bar{x}は平均値を示す。ばらつきを,無次元化して比較する時に便利である。たとえば,人間の身長のばらつきと微生物の大き さのばらつきを比較する場合(意味があるのかな?)である。 大地震の発生の長期的な予測のパラメータによく使われている。
地震発生間隔の平均値とその変動係数(標準偏差を平均値でわったもの)である。
以下の例では,\sigmaをもちいているが,u(不偏分散の平方根)を用いるのが正しいと思う。(山)

A simulation-based approach to forecasting the next great San Francisco earthquake
J. B. Rundle et al.
Proc Natl Acad Sci, 2005, 102, 15363?15367.
A measure of the variability of recurrence times is the coefficient of variation cv of the distribution of values. The coefficient of variation is the ratio of the standard deviation to the mean cv [equivalent] σ/μ. For periodic earthquakes, we have σ = cv = 0; for random (Poisson) distribution of interval times, we have σ = μ and cv = 1. For our simulations of great earthquakes on the San Francisco section of the San Andreas fault, we found that cv = 0.6 for earthquakes having mSF > 7.0.

地震の予知には,動く歩道の酔歩(BPT:Brownian Passage Time)モデルが使われている。* 島崎邦彦 地学雑誌 110, 816-827, 2001.
*BPTモデル:地震の発生を, 動く歩道に乗って終点につく時間に近似したモデル。動く歩道にのってじっととまっていれば一定の時間で到着するが,よっぱらいが前後に動くと(酔っぱらい の経験では 前後に動くことはない。前に進む速度および横への移動ががとてもばらつくだけだ。)到着時間がばらつく。地震において,動く歩道はプレートの運動の解放で あり,酔っ払いは周辺でおこる地震による応力の追加および解放である。BPTモデルにおける2つのパラメータは,地震発生間隔の平均値とその変動係数であ る。

有田 一彦氏のサイトへ:地震発生確率の大いなる曖昧さ

§ 基礎分析化学講習会:08July
2008年6月27日に日本分析化学会近畿支部主催(大阪市立大学文化交流センター研修室1) で著者3人で2時間の講習会をおこないました。80名弱の皆様にお越し頂きありがとうございました。
1. 分析化学における実験データの正しい扱い方(1)
(京工繊大)前田耕治氏
2. 分析化学における実験データの正しい扱い方(2)
(京大)山本雅博氏、加納健司氏
本の内容に加えてさらにどこにも書いてないような新しい内容を織り込みました。 ここに,講習会の報告,講演1,講演2のPPTのPDF,メスピペットの(参加者による)読みの アンケート結果について掲載します。

PDF:分近ニュースレー ター08年7月号に掲載された講習会報告

PDF:分析化学における実験データ の正しい扱い方(1)(京工繊大)前田耕治氏 全量ピペットの後流れの時間依存性の実験は秀逸です。吸光度(透過度)測定をデジタルではなくアナ ログでみるとその意味がよくわかります。

PDF:分析化学における実験 データの正しい扱い方(2) (京大)山本雅博氏、加納健司氏 吸光度から濃度を求める際の最小自乗法について解析法が正しくないと容易に10% の誤差がでます。その他分布の意味,エラーバーの正しい求め方について

PDF:メスピペットの読みの アンケート結果 (京大)加納健司氏 この結果をどのように考えたらいいのでしょうか? 我々には,講習会をする意味が完全に吹っ飛ぶぐらいのインパクト!!がありました。


§ 四捨五入についてp43-p44:
 F県立大(著者2名のふるさとにあり,著者の前任校)のI先生(著者のボス)から よく意味わからない,観測に重みはつかないはずなのに四捨五入の方法によっては 重みがかわってくるのでは?”との質問がありました。
通常の四捨五入(JIS 規則B)と 本で紹介した四捨五入(規則A)がありそれぞれの長所と短所をもちます。
整理すると, 「規則Bでは、端数の5をすべて切り上げにするので、 分布は全体として正に若干偏るが、まるめた後の隣合う 数値の重みに差はない。 一方、規則Aでは、全体としての分布にバイアスは かからないが、まるめた後の隣合う数値の重みに差が出る。」 ということになるでしょうか。
例として,ある測定値の小数点2桁目を丸める(四捨五入)する例を考えます。 JIS-A(ISO,Round-to-even method, unbiased rounding, convergent rounding, statistician's rounding, Dutch rounding or bankers' rounding)の方式を上に, 通常の四捨五入(JIS-B, Symmetric Arithmetic Rounding or Round-Half-Up) を下に書きます。
図を書いてみると  ISO(JIS-A)方式だと,3.0(緑)は11個,3.1(青)は9個という繰り返しになりますので  重みが,3.0と3.1では違うことになりますかね。  通常の四捨五入(JIS-B)方式では10個です。
端数処理に関しましては,Wikipediaの端数処理のページ   Wikipediaの端数処理のページ を参考にさせていただきました。
次の増刷(第3刷)があれば上記の点修正します。(08/05/26)


§ 津村ゆかりさんのサイトで(津村さんにしかできない)Critical Reviewを頂いております。 問題がある部分はすべてYが書いたところです。大反省してます。次のversionで加筆致します。(08/3/19) ⇒  分析化学/化学分析を延々と語る by 津村ゆかりさん
N-1 と Nの問題は,平均値をとることで,拘束条件がひとつ増えたので自由度は一つ減ったという意味で書いたつもりです。伝わりませんでした。著者3 人の会議で何度もつるしあげられましたので残念です(笑)。

§ 08Sep.追記
すでに頂いている多くの批判として,
「数式が多くて読む気にならない」
「数式のところを読み飛ばせていっても」むずかしすぎてわからない

というご意見を多数頂いております。

 ・結果だけを使いたい方
は式の導入をすっ飛ばして頂いて,「使う(える)式」だけを御覧くださればいいようにしております。
 ・ちょっと意味を知りたい方は,
式の導入をちらっとでも御覧くだされば幸いです。
 ・もっと深い意味を理解されたい方は,
参考文献を御覧下さい。現在入手可能な本をあれこれ検討しまして,
  最も判りやすい本を参考文献にいたしました。

数式なくして,「いちから理解できる**」本みたいに薄っぺらい内容に するんかというと,どうなんでしょうか??
それがいやだっただけです。個人的な趣味です。すんまへん。 堪忍え〜!(←イントネーション注意!)

どうせ誰も数式の所は読まないとはおもっていたんですが,
某大学の物理の先生のように
半期をつかってきちんと教えて頂いているところもあります。

で,どうするかと?

わからんという人には,どこまでも迎合しないことにしました。(どこまでも生意気な奴〜!)
最低ラインは守らないといけません。某夏の学校での出来事から強くそう思うようになりました。
ただし,ちゃんと教えないとだめですよね。
The mathematics at the level of most physical chemistry courses requires
about 20 % talent and 80 % confidence, which any chemistry student can gain by
doing lots of problems. (D. McQarrie)

ということですので。問題をもっとつくればよかったですね。



§7章に例題を追加しました。08/02/28 例題追加7章(PDF)

§例題5.1-5.2をこのように変更しました。08/02/28 例題5-1,5-2変更箇所(PDF)

§例 題5.1のpHの誤差の表示
---07/12/12
微妙ですね.
pH問題としては,現実的にはあまり問題ないように思いますので,もとの数字を
ちょっと変えて,どちらでやってもいい値がないもんでしょうか?

ただし,対数変換に関する誤差ということを一般的に考えると,気をつけなけれ
ばならないことがありますから,ジョンソンさんがおっしゃるように,誤差が小
さければ,変換しても大問題ではないけど,大きくなると,+と−の誤差に差が
でてくることを再度触れておいてはいかがでしょうか? (K)
---07/12/11
誤差の件、広めにとって数値だけ直すという
ことであれば、増刷のときに修正可能です。 (M)
---
微妙なところですが、間違いではないように思います。
大きくとれば、±0.03, ±0.04, ±0.09 なんでしょうか。
とりあえず、HPで以下の件を載せましょうか?
帰ったら作ります。 (Y)
---
例題5−1は、
 (1.23±0.07)x10-2 mol dm-3 (dy/y=0.057)を 
 pHに変換する問題で、log e x dy/y により、
 1.91±0.02と解答しましたが、
 実際にはプラス0.0254、マイナス0.0240です。

 例題5−2は、pH→H+濃度の問題で、

  3.12±0.02 → ( 7.6 ±0.3 ) x10-4 と書いたが、
   実際は、プラス0.363、マイナス0.336
    
  3.74±0.02 → ( 1.82 ±0.08 ) x10-4と書いたが、
   実際は、プラス0.0858、マイナス0.0819   

訂正すべきかどうか、微妙なところです。誤差を過大評価しすぎず、切捨てOKとなるのか。。。? (M)
---07/12/10
誤差がそれほど大きくないときは、
対数にしてもそれほど非対称になりません。

 ln (y pm dy) = ln y(1 pm dy/y) = ln y pm dy/y   となるからです。
 dy /y の大きさが小さければ修正の必要はないと思います。 (Y)
---
例題5.1のpHの誤差の表示が、例題9.1で述べている対数の誤差が上下非対称になるということと
整合性を欠いてしまいました。有効数字だけにしておきばよいものを誤差まで表示したのが悪かったようです。
指摘があったら、正確には、例題9.1にしたがって誤差を表すべきだとしてください。(M)

§査読をお願いした先生方への手紙より

07/12/03  

 拝 啓 師走の候、益々ご健勝のこととお慶び申し上げます。

 ...著 者の知識や経験の及ばないところで、重要なご指摘、コメント、アドバイスを多数いただいたこと、大変感謝しております。お陰様をもちまして、このたび、無 事に刊行の運びとなりました。...もしお気づきの点があれば、さらにご意見、ご批判をいただければと思います。(M)

「最初の取っかかりは,M先生から『こういう本が売 れるのか出版社から問い合わせがきてる』とのことでした。学生実験で教えるのに適当な本がないので是非書いて下さいとお答えしました。M先生が書くと思っ ていたからです。その後お調子者の私(およびK先生も?)うまくのせられまして,お手伝いすることになりました。まさか,統計にずぶの素人というより学生 時代に数理統計・品質管理でドロップアウトした私が書くとは思っておりませんでした。本に間違いがないか未だに心配ですが,“本を書くとは自分の恥をさら す(京大化研花井先生談)”ことだそうですので,もし間違いがあったら私の不徳のいたすところですという心境です。」(Y)

「統計という領域に決し て明るくない私が加わっているというのは,皆様方にも奇異に映ったことでしょう.実際,本書のことで,M先生,Y先生とご一緒させていただき,私には,統 計やデータの扱いのことを考えさせてもらう絶好の機会になりました.いろいろ,素人が口をはさむうちに,回帰の際の重みの取り扱いのことやら,より深く考 え,いろいろ教えてもらうことになりました.初歩的なことから,マニアックなことまで,含まれているのは,そんな背景も反映されたのかもしれません.皆様 方には貴重でかつ温かいコメントをたくさんいただきありがとうございます.皆様に心から感謝しつつ,3人で七輪を囲みます.」
(K)


本に対するご質問,ご批判,コメント等は化学同人編集部にお願いします。 また,著 者に直接お聞きくださっても結構です。ご回答は,この場でなるべくさせていただければと存じます。