§
-------非線形最小二乗回帰における初期値問題--------09/03/15
ある先生が,以前某雑誌に投稿した時に,非線形最小二乗回帰で
あるパラメータをだしたところ
refreeからその回帰の計算結果は残差のローカルミニマムであり
もっと残差がすくないグローバルミニマムがあるはずだとの指摘をうけたとのこと。
初期値依存性をチェックしてなかったためにやってしまったと言ってはりました。
あるソフトでは、非線形回帰でフィットする初期値パラメータを自動でわりふるためだったようですが、
我々が本で示したようにこのようなことが十分起こりえます。出版される前に気づいてよかったんですが、
最悪の場合業界を去らないといけない事態にもなります。明日はわが身。(MY)
§
小林-益川理論の検証実験:KEK B-factory(Belle) vs SLAC(BaBar)
B0中間子とその反粒子で観測される崩壊確率のずれの大きさでCP(charge conjugation
symmetry and parity symmetry)
violationが検証できるらしい!??。「CPの破れ」を計算したとき,求められた中心値(下図の丸印:平均値のこと?)に対して,誤差の幅(下図のエラー
バー)が中心値の1/3以下になると,「CPの破れがその中心値になる確率」は99%以上となる。したがって,「CPの破れを99%の確率で発見した」と
いうには,中心値がゼロでなく誤差がその中心値の1/3でなくてはならない。この検証レースに,米国スタンフォードのSLACはKEK(高エネ研KEK)
よりつねに先行していたが,上の条件を満たしていなかったために「発見」には至らなかった(2000年7月)。その後,KEKの装置の改良が功をそうし
て,ほぼ同時に上の条件を満たし「発見」となったようである。(2001年7月「発見発表」,最終確定2002年7月)
ベストデータだけで議論することなく,誤差が確定するまでは発見にはならないという素粒子実験家のFairな「姿勢」を見習いたいですね。特に、ベストデータだけで堂々と「発見!」といっておられる一部業界の方には耳の痛い話ですね。(MY)

以上 日経サイエンス2009年3月号 pp.92-107 「巨大加速器実験,日米の闘い」より
§
--------------定義追加------------------08/10/22
赤池情報量基準:AIC (Akaike's information criterion)
Fitする関数のパラメータを増やしていけば(例えば,多項式fitの場合,項の数がパラメータの数になる。)
,通常はデータとよく一致するようになるが
パラメータの数がどの値の時にベストであるかを残差だけから見極めることは容易ではない。
(例えば,緩和現象を記述するのに,1つあるいは2つの指数関数で近似する場合があるが
どちらでもいい!ように見えることが多いですね。)
目で見て判断するといういい加減な基準でいいとさえ思ったりする。
赤池弘次氏は以下のAICが最小値を持つ時にモデルが最適であることを示した。
AIC = -2 ln[最大尤度(ゆうど)] + 2*パラメータの数
モデルとして最小二乗法を使うときには,
AIC = n*ln(S)+2*(m+1)
ここで,nはデータ数,Sは残差二乗和(教科書でのχ二乗に相当する),mはパラメータの数である。
多項式でのfitとAICの関係が,中川-小柳「最小二乗法による実験データ解析:プログラムSALS」のpp.153-155に例として示されており,
AICの最小が最適なfitであることを示している。
★将来予測に欠かせぬ尺度/赤池情報量規準 (aspara
科学面にようこそ)米山正寛081006朝日新聞 [現場から積み上げた数学(統計学)というのが面白いですね!」
朝
日新聞記事の引用サイトへ
朝日新聞記事のpdfへ
東
洋大学 吉野隆先生によるAICの解説へ
AICに関しては何冊か目を通したが、吉野先生のサイトでも紹介されている
坂本慶行,石黒真木夫,北川源四郎,情報量統計学,共立出版,1983
の本が最もわかりやすい。(と、詳しく読んでもいないのに言っていいのか?)(MY)
§
--------------定義追加------------------08/10/20
変動係数:coefficient of variance = u / \bar{x}
ここで,uは不偏分散,\bar{x}は平均値を示す。ばらつきを,無次元化して比較する時に便利である。たとえば,人間の身長のばらつきと微生物の大き
さのばらつきを比較する場合(意味があるのかな?)である。
大地震の発生の長期的な予測のパラメータによく使われている。
地震発生間隔の平均値とその変動係数(標準偏差を平均値でわったもの)である。
以下の例では,\sigmaをもちいているが,u(不偏分散の平方根)を用いるのが正しいと思う。(山)
A simulation-based approach to forecasting the next great San Francisco
earthquake
J. B. Rundle et al.
Proc Natl Acad Sci, 2005, 102, 15363?15367.
A measure of the variability of recurrence times is the coefficient of
variation cv of the distribution of values. The coefficient of
variation is the ratio of the standard deviation to the mean cv
[equivalent] σ/μ. For periodic earthquakes, we have σ = cv = 0; for
random (Poisson) distribution of interval times, we have σ = μ and cv =
1. For our simulations of great earthquakes on the San Francisco
section of the San Andreas fault, we found that cv = 0.6 for
earthquakes having mSF > 7.0.
地震の予知には,動く歩道の酔歩(BPT:Brownian Passage Time)モデルが使われている。* 島崎邦彦 地学雑誌 110,
816-827, 2001.
*BPTモデル:地震の発生を,
動く歩道に乗って終点につく時間に近似したモデル。動く歩道にのってじっととまっていれば一定の時間で到着するが,よっぱらいが前後に動くと(酔っぱらい
の経験では
前後に動くことはない。前に進む速度および横への移動ががとてもばらつくだけだ。)到着時間がばらつく。地震において,動く歩道はプレートの運動の解放で
あり,酔っ払いは周辺でおこる地震による応力の追加および解放である。BPTモデルにおける2つのパラメータは,地震発生間隔の平均値とその変動係数であ
る。
有田
一彦氏のサイトへ:地震発生確率の大いなる曖昧さ
§
基礎分析化学講習会:08July
2008年6月27日に日本分析化学会近畿支部主催(大阪市立大学文化交流センター研修室1)
で著者3人で2時間の講習会をおこないました。80名弱の皆様にお越し頂きありがとうございました。
1. 分析化学における実験データの正しい扱い方(1)
(京工繊大)前田耕治氏
2. 分析化学における実験データの正しい扱い方(2)
(京大)山本雅博氏、加納健司氏
本の内容に加えてさらにどこにも書いてないような新しい内容を織り込みました。
ここに,講習会の報告,講演1,講演2のPPTのPDF,メスピペットの(参加者による)読みの
アンケート結果について掲載します。
PDF:分近ニュースレー
ター08年7月号に掲載された講習会報告
PDF:分析化学における実験データ
の正しい扱い方(1)(京工繊大)前田耕治氏 全量ピペットの後流れの時間依存性の実験は秀逸です。吸光度(透過度)測定をデジタルではなくアナ
ログでみるとその意味がよくわかります。
PDF:分析化学における実験
データの正しい扱い方(2) (京大)山本雅博氏、加納健司氏 吸光度から濃度を求める際の最小自乗法について解析法が正しくないと容易に10%
の誤差がでます。その他分布の意味,エラーバーの正しい求め方について
PDF:メスピペットの読みの
アンケート結果 (京大)加納健司氏 この結果をどのように考えたらいいのでしょうか?
我々には,講習会をする意味が完全に吹っ飛ぶぐらいのインパクト!!がありました。
§
四捨五入についてp43-p44:
F県立大(著者2名のふるさとにあり,著者の前任校)のI先生(著者のボス)から
よく意味わからない,観測に重みはつかないはずなのに四捨五入の方法によっては
重みがかわってくるのでは?”との質問がありました。
通常の四捨五入(JIS 規則B)と
本で紹介した四捨五入(規則A)がありそれぞれの長所と短所をもちます。
整理すると,
「規則Bでは、端数の5をすべて切り上げにするので、
分布は全体として正に若干偏るが、まるめた後の隣合う
数値の重みに差はない。
一方、規則Aでは、全体としての分布にバイアスは
かからないが、まるめた後の隣合う数値の重みに差が出る。」
ということになるでしょうか。
例として,ある測定値の小数点2桁目を丸める(四捨五入)する例を考えます。
JIS-A(ISO,Round-to-even method, unbiased rounding, convergent rounding,
statistician's rounding, Dutch rounding or bankers' rounding)の方式を上に,
通常の四捨五入(JIS-B, Symmetric Arithmetic Rounding or Round-Half-Up)
を下に書きます。

図を書いてみると
ISO(JIS-A)方式だと,3.0(緑)は11個,3.1(青)は9個という繰り返しになりますので
重みが,3.0と3.1では違うことになりますかね。
通常の四捨五入(JIS-B)方式では10個です。
端数処理に関しましては,Wikipediaの端数処理のページ
Wikipediaの端数処理のページ
を参考にさせていただきました。
次の増刷(第3刷)があれば上記の点修正します。(08/05/26)
§
津村ゆかりさんのサイトで(津村さんにしかできない)Critical Reviewを頂いております。
問題がある部分はすべてYが書いたところです。大反省してます。次のversionで加筆致します。(08/3/19)
⇒
分析化学/化学分析を延々と語る by 津村ゆかりさん
N-1 と Nの問題は,平均値をとることで,拘束条件がひとつ増えたので自由度は一つ減ったという意味で書いたつもりです。伝わりませんでした。著者3
人の会議で何度もつるしあげられましたので残念です(笑)。
§
08Sep.追記
すでに頂いている多くの批判として,
「数式が多くて読む気にならない」
「数式のところを読み飛ばせていっても」むずかしすぎてわからない
というご意見を多数頂いております。
・結果だけを使いたい方は式の導入をすっ飛ばして頂いて,「使う(える)式」だけを御覧くださればいいようにしております。
・ちょっと意味を知りたい方は,式の導入をちらっとでも御覧くだされば幸いです。
・もっと深い意味を理解されたい方は,参考文献を御覧下さい。現在入手可能な本をあれこれ検討しまして,
最も判りやすい本を参考文献にいたしました。
数式なくして,「いちから理解できる**」本みたいに薄っぺらい内容に
するんかというと,どうなんでしょうか??
それがいやだっただけです。個人的な趣味です。すんまへん。
堪忍え〜!(←イントネーション注意!)
どうせ誰も数式の所は読まないとはおもっていたんですが,
某大学の物理の先生のように
半期をつかってきちんと教えて頂いているところもあります。
で,どうするかと?
わからんという人には,どこまでも迎合しないことにしました。(どこまでも生意気な奴〜!)
最低ラインは守らないといけません。某夏の学校での出来事から強くそう思うようになりました。
ただし,ちゃんと教えないとだめですよね。
The mathematics at the level of most physical chemistry courses requires
about 20 % talent and 80 % confidence, which any chemistry student can
gain by
doing lots of problems. (D. McQarrie)
ということですので。問題をもっとつくればよかったですね。
§7章に例題を追加しました。08/02/28
例題追加7章(PDF)
§例題5.1-5.2をこのように変更しました。08/02/28
例題5-1,5-2変更箇所(PDF)
§例
題5.1のpHの誤差の表示
---07/12/12
微妙ですね.
pH問題としては,現実的にはあまり問題ないように思いますので,もとの数字を
ちょっと変えて,どちらでやってもいい値がないもんでしょうか?
ただし,対数変換に関する誤差ということを一般的に考えると,気をつけなけれ
ばならないことがありますから,ジョンソンさんがおっしゃるように,誤差が小
さければ,変換しても大問題ではないけど,大きくなると,+と−の誤差に差が
でてくることを再度触れておいてはいかがでしょうか? (K)
---07/12/11
誤差の件、広めにとって数値だけ直すという
ことであれば、増刷のときに修正可能です。 (M)
---
微妙なところですが、間違いではないように思います。
大きくとれば、±0.03, ±0.04, ±0.09 なんでしょうか。
とりあえず、HPで以下の件を載せましょうか?
帰ったら作ります。 (Y)
---
例題5−1は、
(1.23±0.07)x10-2 mol dm-3 (dy/y=0.057)を
pHに変換する問題で、log e x dy/y により、
1.91±0.02と解答しましたが、
実際にはプラス0.0254、マイナス0.0240です。
例題5−2は、pH→H+濃度の問題で、
3.12±0.02 → ( 7.6 ±0.3 ) x10-4 と書いたが、
実際は、プラス0.363、マイナス0.336
3.74±0.02 → ( 1.82 ±0.08 ) x10-4と書いたが、
実際は、プラス0.0858、マイナス0.0819
訂正すべきかどうか、微妙なところです。誤差を過大評価しすぎず、切捨てOKとなるのか。。。? (M)
---07/12/10
誤差がそれほど大きくないときは、
対数にしてもそれほど非対称になりません。
ln (y pm dy) = ln y(1 pm dy/y) = ln y pm dy/y
となるからです。
dy /y の大きさが小さければ修正の必要はないと思います。
(Y)
---
例題5.1のpHの誤差の表示が、例題9.1で述べている対数の誤差が上下非対称になるということと
整合性を欠いてしまいました。有効数字だけにしておきばよいものを誤差まで表示したのが悪かったようです。
指摘があったら、正確には、例題9.1にしたがって誤差を表すべきだとしてください。(M)
§査読をお願いした先生方への手紙より
07/12/03
拝
啓 師走の候、益々ご健勝のこととお慶び申し上げます。
...著
者の知識や経験の及ばないところで、重要なご指摘、コメント、アドバイスを多数いただいたこと、大変感謝しております。お陰様をもちまして、このたび、無
事に刊行の運びとなりました。...もしお気づきの点があれば、さらにご意見、ご批判をいただければと思います。(M)
「最初の取っかかりは,M先生から『こういう本が売
れるのか出版社から問い合わせがきてる』とのことでした。学生実験で教えるのに適当な本がないので是非書いて下さいとお答えしました。M先生が書くと思っ
ていたからです。その後お調子者の私(およびK先生も?)うまくのせられまして,お手伝いすることになりました。まさか,統計にずぶの素人というより学生
時代に数理統計・品質管理でドロップアウトした私が書くとは思っておりませんでした。本に間違いがないか未だに心配ですが,“本を書くとは自分の恥をさら
す(京大化研花井先生談)”ことだそうですので,もし間違いがあったら私の不徳のいたすところですという心境です。」(Y)
「統計という領域に決し
て明るくない私が加わっているというのは,皆様方にも奇異に映ったことでしょう.実際,本書のことで,M先生,Y先生とご一緒させていただき,私には,統
計やデータの扱いのことを考えさせてもらう絶好の機会になりました.いろいろ,素人が口をはさむうちに,回帰の際の重みの取り扱いのことやら,より深く考
え,いろいろ教えてもらうことになりました.初歩的なことから,マニアックなことまで,含まれているのは,そんな背景も反映されたのかもしれません.皆様
方には貴重でかつ温かいコメントをたくさんいただきありがとうございます.皆様に心から感謝しつつ,3人で七輪を囲みます.」
(K)
本に対するご質問,ご批判,コメント等は化学同人編集部にお願いします。
また,著
者に直接お聞きくださっても結構です。ご回答は,この場でなるべくさせていただければと存じます。