「広島、長崎、ハンフォード、そして福島のデータを再分析」濱岡豊慶応大学教授 9/21第5回 市民科学者国際会議(文字起こし)

第5回 市民科学者国際会議
~東京電力福島第一原子力発電所事故の放射線被ばくによる
健康影響を科学的に究明し、防護と対策を実現するために~
2日目 日時:2015年9月21日(月・祝)



濱岡 豊
所属:慶応大学商学部
専門:マーケティング・サイエンス、イノベーション・マネジメント
プロフィール

広島県生まれ。東北大学工学部卒、東大大学院修了(工学修士:原子力、学術博士:先端学際工学)。1996年から慶応大学商学部にてマーケティング・リサーチ、製品開発論、データ分析などを教える。研究対象は、消費者間のクチコミ、企業や消費者によるイノベーション等。研究アプローチは事例研究やデータ分析。東日本大震災後は放射線の健康影響に関するデータの批判的(再)分析も行っている。主要著書『消費者間の相互作用についての研究』『Webマーケティングの科学』。放射線の健康影響に関しては「放射線被曝と甲状腺結節(岩波書店・「科学」2015年6月号)」「広島、長崎被曝者データの再分析(同9月号)」「長期低線量被曝関連研究からの知見・課題と再分析 (同10月号掲載予定)」などがある。





53:15〜
濱岡1
濱岡と申します。
慶応の商学部でマーケティングを現在教えています。
プロフィールに書いてある通り、学部は工学部で、大学院で原子力を2年間学んだりということもあって、福島事故以来放射線のことに関していろいろ騒がれていますので。
例えば100mSv以下では影響が見られるとか見られないとか、そういった話がどうなっているのかということを、データが公開されていますので、そのデータ。
私はもともと理系ということもあってマーケティングを教えているんですが、特にデータを使っていろいろ結論を出すとか、そういうアプローチでマーケティング研究をしてきたので、わりとデータ分析という観点から見るといくつかいろんな問題があるのかな、ということがわかってきたような気がしますので、それを今回はご報告したいというふうに考えています。

広島、長崎、ハンフォード、福島、いずれも被ばくに関係しているという共通性があって、それぞれのデータが公開されているので、そのデータを再分析するというのが具体的な内容になっています。

濱岡2

内容としてはこんな感じになっていまして、そういう意味で非常にテクニカルな話になってしまうので申し訳ないんですけれども、少しでも苦痛を和らげるために、最初に原爆被爆者データ分析入門ということで、ちょっとだけを、基本的な分析の考え方を若干ご紹介させていただいて、その分析の課題。
実際に再分析してみて、その問題がどのくらい重要なのかということを明らかにしようということをします。
あとは、ハンフォードを含めた原爆被爆者のデータというのは公開されている、本当はひとりひとりのなんですが、
公開されるデータというのは匿名性を確保するという点もあるんだろうと思うんですけれども、ある程度集計されたデータが公開されていると。
集計するといろいろと良くないことが、統計的検定力件数力が落ちるということがありますので、その辺の問題がどのくらい重要なのか?というふうなことを。
米国の場合はそれに対して個人レベルのデータが公開されていますので、個人レベルの分析をしたらどうなるのか?ということをやってみたのが米国3施設データの部分になります。
あとちょっと前の部分とはあまりつながりはないんですけれども、福島の甲状腺データの公開されている市町村別のデータですね、それの特に結節のデータを分析をしてみるというのが3番目の内容になっています。


濱岡3
目的としましては、書いてある通り、代表的な研究である原爆被爆者の分析方法について批判的に検討して問題点を把握しましょうと再分析することによって問題を明らかにして、先ほど申した「個人レベルの集計による」という大きな問題があると考えられますので、そもことを米国のデータを使ってより再確認しましょうと。
あと、福島のデータもいじってみます。
というような内容になっています。

濱岡4

最初に被爆者のデータの分析ということで、1950年以来ABCCもしくはRERFが被爆者のデータを集めているわけです。
9万4000人の被爆者及び被ばく時点では市内にはおられなくて、その後入った、来られた方約2万7000人を追跡調査していることになっています。
こういうデータを集めて5年から10年ごとに分析結果をまとめて報告するというのがずっと続けられていて、直近のメインレポートというのが2012年に報告された14報になっています。
この調査のことをLife Span Study (LSS) と呼ばれていますので、今後LSS14とかLSS13というのは、それぞれ2003年のレポートの、もしくは2012年最新のレポートのことを意味しています。


濱岡5
これがLSS14報データを集計してみたものになっています。
こちらが線量になっていて、それぞれの線量の中に何人いらっしゃるのかと。
そして線量推定されているのが8万6000人なので、大体の分析はこの8万6000人に対して分析が行われています。

8万6000人のうち5万人程度が亡くなられて、
そのうち固形癌で亡くなられた方がトータルで1万人。
それを線量ごとに見てみると、
こちらは下にカッコが付いていますけれど、このカッコというのは死亡数に占める固形癌で亡くなられた方の割合ということになっています。

ご覧の通り線量が一番低いところだと20%ですかれども、線量が高くなるにつれて21%、そして29%というふうに、被ばくによって固形癌で亡くなる方の割合が増えている。
白血病も同様になっていますよね。
これが基本的な分析の仕方になります。

これをグラフで書いたのがこんな感じになります。
濱岡6

ですから基本的にはこれに直線を当てはめるのか、上にそった形を当てはめるのかというふうなことをするわけです。
これは線量だけを考えていますけれども、ご覧のようにそれぞれの線量によって、広島長崎とか、男性女性の割合、被爆時年齢なども若干異なっていますので、実際の分析では線量だけではなくて、この辺の変数も当然勘案して分析をするということになっています。

実際のデータですとこんな感じになっています。
公開されているデータ
濱岡7
こちらに行くと、登録すれば簡単にダウンロードできるようになっています。

こんな感じで線量が22区分、都市、性別、被爆時年齢と到達年齢が5歳ごとに区切られて集計されたデータが公開されているということになっています。

今のデータをプロットしてみたものがこのチャートになっています。
濱岡8

横軸が被ばく量で縦軸が固形癌で亡くなられた方の割合になっています。
丸の大きさがそれぞれのセルに何人いるのか、ということに比例して丸の大きさが書かれています。
先ほどのシンプルなものだと直線が明確に見えたんですけれども、実際にこういうデータを見ると非常にばらついていますよね。
ですからこれにどういう直線を、直線というか、線量応答関数というんですけれども、どのような関数計を相当するのかというのが一つ重要な問題になります。

ここでの赤線は現在のところは被ばく量とともに固形癌死が増えるという、よく言われるリニアのロースレッショのモデルというものを想定したのがこの赤い線になっています。
方程式で書くとβ0+β1×dと。
dが被ばく量ですね。
重要なのはβ1というパラメーターで、ここにあるように被ばく量が1Gy増えるごとに固形癌死する方の割合がどれくらい増えるのかということを表すのがβ1というパラメーターになります。
あと、統計学的に非常に重要なのはこのβ1がゼロなのかどうなのか?ということが非常に重要になるわけですね。
β1がゼロだということは、この直線が完全に寝てしまうわけですね。
β1がゼロの時には、被ばく量dがいくらであってもこの高さが変わらないということなので、あとあと検定などをする時に重要になってくるのはこのβ1がゼロなのかどうか?ということが非常に重要なポイントになってきます。
これは直線だけを想定していますけれども、LSSスタディーでは幾つかの関数計を想定しています。

濱岡9

これが扇形になっていまして、波線のやつがシンプルな閾値モデルになっています。1:02:41(画像切れる)


濱岡10

1:04:17〜
ですから過剰相対リスクということになりまして、 f(d)というのがさっきグラフでお見せした線量関数というものになります。
同じ1Gy浴びても男性とか女性とか年齢とか、被爆者の特性によってその影響が異なってくるだろうということなので、先ほどの線量応答関数にそれをかけて修正するという不仲たちのモデルになっています。
被爆者の特性についてはこんな感じで、被ばくされた方の性別と何歳で被ばくされたのかと。
その方が例えば70歳になったときに癌死する確率がどれくらい増加するのか、というふうな形でモデルが推定されています。

濱岡11

実際にこれを推定してみた結果がこのチャートになっています。↑
被ばく量のところに0.42という数字がありますが、これは1Gy被ばくすると固形癌で亡くなる方の割合が42%増加するということを意味しています。

隣に標準誤差というのがありますが、これは8万6000という有限なサンプルなので推定値にも誤差があるということなので、その誤差を評価したものになっています。

t値 というのが、0.42を0.05で割ったものになります。
t値 が決まるとP値というものが自動的に決まるんですけれども、
P値 というのは、先ほど申しましたように係数がゼロかどうか?というのが非常に重要なので、係数がゼロだという、いわゆる帰無仮説ですね、null hypothesisを検証した結果を前提とした時に、t値が8.4になる確率がどれくらいあるのか?ということを表したのがこの P値 、確率値になっています。

ま、ご覧のように非常に確率が低いわけですね。

係数がゼロだった時にP値 が8.4になるような確率は0.1%よりも小さいですよと。
ありえないことが起きているので、そもそもの仮説を棄却しましょうと。
ですから「ゼロである」という仮説を棄却するので、ま、ちょっといい加減にいうと「ゼロではない」と。
「被ばく量が増えると死亡する確率も増えます」ということがこの結果から言えると。


どれくらい稀だったら仮説を棄却するのか?ということなんですけれども、だいたい5%よりも小さい時には仮説を棄却しようというのが一般的な考え方ですので、5%よりも小さければここに星(*)がつくということになります。

あと信頼区間というのは、これもちょっといい加減な説明になりますけれども、95%の確率で真の係数がこの中に入っているということなので、チェックポイントとしてはこの信頼区間の中にゼロが含まれているかいないかということが重要なポイントになります。

ですから今の場合はP値が5%よりも小さいですし、星(*)もついているし、信頼区間もゼロを含んでいないということですから、これは確かに被ばく量と癌死の確率には正の相関があると。
統計的に見て有意の正の相関があるということが言えるわけです。


あと、被爆時年齢についてはマイナスですね。
ですからこれは被ばくした時の年齢が高いほど癌死のリスクは低くなるということを意味しています。

同じように星(*)が付いていますね。

ということは逆に言うと、「子供が被ばくするとリスクはより高くなりますよ」と。
放射線の影響は子供の方が受けやすいと言うのは、ここの結果から言われることになっています。

あと、到達年齢もマイナスになっている。
これはなんとなく直感的には歳を取るほど癌死する人が増えるような感じがするんですけれども、これは相対的なことを言っていますので、「実数は増えるけれどもその中で被ばくによる死者の割合は減っていきますよ」と、そういうことになっています。

性別については女性が1で男性がマイナス1なので、「女性の方が影響を受けやすい」というふうなことになっています。

今のやつをプロットしたものがこれになっています。↓
濱岡12

横軸が到達年齢で縦軸がリスクになってて、それを被ばく時年齢ごとにプロットしたものがこれになっています。
先ほどの0.42というのはここ(赤丸)ですけれども、これは30歳で被ばくした人が70歳になった時に固形癌で亡くなる確率がどれくらい増加するのかということを意味しているわけです。

ご覧のように被ばく時年齢が、ちょっと消えていますけれども、これ(一番上のライン)が10歳ですね。
10歳、20歳、30歳、40歳、50歳と。
先ほどあったように被ばく時年齢が若いほどこのリスクは高くなるという、非常に重要な結果だと思います。

こういうふうに、非常に素晴らしい分析をしているようには見えるんですけれども、色々細かく見ていくと、つぎのこんな感じのいろんな問題点があるのではないかと。
濱岡13

濱岡14
ちょっと一つ一つご紹介している時間がないので、今日はこの個人レベルデータを集計することによる問題点と、低線量域にサンプルを限定することの問題点、そして不完全なモデル選択という、主にこの3つの結果を紹介したいというふうに思います。


01:10:17
濱岡15

今の推定というのはずべてのデータを用いて推定したわけですけれども、LSS13報ではこんな感じで、データの線量の範囲を限定して推定しています。
例えば一番上のこれですとゼロから50mSvまでの人だけを使って今と同じことを推定したと。
そうすると、P値が15%になっていて、当然星(*)は付いていないですよね。
同じように100までだと30%になって、また星(*)が付いていないんだけれども、
125ぐらいになるとP値が5%よりも低い2.5%になるので、星(*)が付いて、ここからなんか有意になるということになっていますよね。
で、これが多分「100mSv以下では統計的に有意な影響がみられない」というものの背景にある分析だと思います。

これはですから、そもそもデータがこんなにいっぱいあるのに、「なぜここだけを取り出すのか?」というのが非常に、ま、データの取り出し方の恣意性というのもありますよね。

ですからもしこういうことをするのだとしたら、すべてのデータを用いて、例えばこういうのところでさっきのかた引きが異なるとかですね、そういう線形スプライニングモデルなどをちゃんと推定してあげたほうがいいだろうというふうに思います。

実際にこのLSS13報ではこういう分析がされましたけれども、LSS14報ではこの分析がされていませんので、多分やった人たちにも「こういう分析には問題がある」ということに気付いたのではないかなと思います。


濱岡16


残念ながらUNSCEARも同じような方法でレポートを書いております。
2006年レポートの中で、
今のは非常にシンプルなモデルでやったんですけれど、線量推定値には誤差があるということを考慮したような、もうちょっと複雑なモデルを使って、線量を今のように限定してサンプル数を減らした上で推定をしたところ、固形がんの脂肪については200ミリシーベルトまで。
発症については250mSvぐらいまでサンプルを使うと星(*)が付いてくるというようなことを報告
1:12:49












ーーーーーー


悲しい・・・
のんびりと文字起こしをしていたら…動画がなくなってしまいました><

http://www.ustream.tv/recorded/73747139

Ustream,からYoutubeになっているかな?とも思って探してみましたが見つけられませんでした。


「これから!」という時だっただけにとても残念です。
途中までですが、ブログにアップします。

とても残念ですが「第5回 市民科学者国際会議」の文字起こしはこれで終わります。


















広島、長崎、ハンフォード、そして福島
低線量被曝研究のための批判的レビューと再分析

濱岡 豊
講演概要

この報告では以下の3つの研究結果を紹介する。広島・長崎の被爆者データの分析は、放射線の健康影響を評価するための重要なデータである。寿命調査Life Span Survey (LSS) の13報 (Preston et al., 2013) 、14報 (Ozasa et al. 2012)を批判的にレビューし、再分析を行った。主要な結果は以下の通りである。(1)個人レベルのデータについて、線量などを離散化して層別に集計することによって、検定力が低下するだけでなく、閾値推定モデルでは閾値が高く推定される。(2) LSS13では、線形モデルについて低線量域にサンプルを限定して推定すると、125 mSvまで用いると有意となるとしている。これはサンプルサイズの減少を無視した不適切な結論であり、すべてのデータを用いて推定すべきである。(3) LSS14では、このような分析はされず、すべてのデータを用いて、ある境界値で直線の傾きが変化する「線形スプラインモデル」を推定しているが、線形モデルとの適合度の比較がされていない。これらを含む8種類の線量—応答関数を推定し、情報量基準(AIC, BIC)によってモデル選択を行った結果、線形モデルが最良となった。
 原爆被爆者の個人データは公開されていないが、ハンフォードなど3原子力関連施設従業員データは公開されている。このデータを層別集計して分析したGilbert et al.(1993)では、累積被曝量と固形がん死には有意な関係がないとしていた。しかし、個人レベルで部位毎のがん死の確率を推定する「2項ロジットモデル」、複数の死因のうちいずれかで死亡するという「多項ロジットモデル」、さらに、死亡までの期間も考慮する「ハザード・モデル」で推定したところ、累積被曝量と固形がん死確率などには有意な関係が得られた。
 層別集計して分析するという手法はLSSをはじめ、原子力関連作業員Mayak, Techa Riverなど放射線疫学の主要な研究で用いられてきたが、低線量被ばくの影響を把握するためには、個人レベルのデータを分析するべきである。
 福島県甲状腺検査の結果について、公開されている市町村レベルのデータについて、UNSCEARの甲状腺被曝線量と甲状腺がん、甲状腺結節との関係を分析した。甲状腺がんについては被曝線量は有意ではなかったが甲状腺結節数については正で有意な係数が得られた。検査時年齢は正、被曝時年齢は負など、LSSと一致する結果である。原爆被曝者(Imaizumi et al., 2005)、チェルノブイリの追跡調査(Hayashida et al.,2012)では結節がある者ほど、その後の甲状腺がんのリスクが高いことが示されている。迅速な対応が必要である










第5回 市民科学者国際会議文字起こしブログ

「CTスキャンによる低線量被ばく後の発がんリスク」ジョン・マシューズ9/21第5回 市民科学者国際会議(文字起こし)

津田敏秀教授9/21第5回 市民科学者国際会議(文字起こし)

キース・ベーヴァーストック(東フィンランド大学環境科学学科)原発事故による甲状腺がんの発症と被曝時の年齢9/21第5回 市民科学者国際会議 2015

<福島とチェルノブイリの野生生物・1>ティモシー・ムソー教授「低用量曝露によって遺伝的損傷が起こるということが示されているのです」9/21第5回 市民科学者国際会議(文字起こし)

白斑「遺伝的影響・放射線の影響”があるという目印」ティモシー・ムソー教授<福島とチェルノブイリの野生生物・2>9/21第5回 市民科学者国際会議(文字起こし)

無精子「だいたい40%の鳥が全く無精子状態であった」ティモシー・ムソー教授<福島とチェルノブイリの野生生物・3>9/21第5回 市民科学者国際会議(文字起こし)

腫瘍・白内障「汚染度が高い地域にはこれは非常に高い」ティモシー・ムソー教授<福島とチェルノブイリの野生生物・4>9/21第5回 市民科学者国際会議(文字起こし)

小頭症「特に小頭症というのが放射能の高い地域ではよく見られています」生態系の異常他 ティモシー・ムソー教授<福島とチェルノブイリの野生生物・5>9/21第5回 市民科学者国際会議(文字起こし)

質疑応答 ティモシー・ムソー教授<福島とチェルノブイリの野生生物・6完>9/21第5回 市民科学者国際会議(文字起こし)

「広島、長崎、ハンフォード、そして福島のデータを再分析」濱岡豊慶応大学教授 9/21第5回 市民科学者国際会議(文字起こし)








関連記事

コメント

非公開コメント

偉い

本当に貴女は偉い!
ココまで文字起こしをする忍耐が在るだけで偉い、と思います。
尊敬と感謝を込めてm(。。)m

No title

これ、見たかったんだあああ~~~。
感謝です。

No title

きーこ様
この項目といい、チェルノブイリの野生動物といい、たばこといい、根気のいる作業、お疲れ様です。本当にありがとうございます。
お体、ご自愛くださいね。寒くなってきましたから...。