脳科学と人工知能の可能性 / 「有意差」と統計の多元性
このブログでは様々な科学者や専門家、当事者を含む記事や動画を紹介しつつ、心・精神というものを多角的に考察していますが、
過去であれ現在であれ、一部の突出した天才や感性の豊かな人の、「個人のみの直感・経験」などに頼るだけではその全体像もメカニズムも理解はできませんし、普遍的なものとして断定することは出来ません。
もちろんそういう方々の仮説にせよ直感にせよ、個人的には面白いと感じることもよくあるし、個人研究として様々なユニークな仮説をたてたり、斬新な主張することも創造性の現れであり可能性のひとつだとは思います。
そして実証はされていなくても、何らかの「先見の明」を含んでいたり、部分的には真実を捉えていることがあったり、その時点では否定されていても後に肯定される場合もある、というようなこともあるわけですが、
どれだけ素晴らしい感じがする理論でも、検証の過程なく論理的帰結のみではいつまでたっても仮説は仮説のままであり、
どれだけ高名で優秀な人の理論であろうと、それだけで科学的事実と認めることはできませんし、「科学的信頼性が高いかどうか」は「わからない」わけです。
例えばニューロン(神経細胞)の詳細な活動を調べる研究において、昔は「オプトジェネティックス(光遺伝学)」と呼ばれる技術などなかったわけで、
二光子顕微鏡なんてまだ十年そこそこの最近の技術なんですね。※ 二光子顕微鏡: 動物の内部. で起きている現象をサブミクロンの解像度でとらえる特殊な顕微鏡
「脳はこういう風に使われている」とか、「こういう伝達ルートになっている」とかを、「直感からの仮説」で過去・現在の天才・秀才の学者が主張したところで、
その人が天才で誰もが認める世界的に優秀・有名な学者だから「その仮説も事実」、とはならないわけです。テレビに出てくる有名人だから、人気が凄くある人だから、も同様です。
心のはたらきの脳内表現を調べる機能的磁気共鳴映像(fRMI)がここ20年くらいのことで、これでようやく脳内の運動性が「推測」ではなく、(ある程度)は「確認」出来るようになってきたわけです。
そして「ディープラーニング」が脳科学の研究に応用されるようになり、脳活動のデータから脳内の情報を読むデコーディング技術が発展してきたのも最近の話です。
下記リンク先にて「脳科学の達人」プレゼンテーションシリーズのアーカイブ動画をご覧になれますので、関心のある方はどうぞ。⇒ 日本神経科学学会市民公開講座 脳科学の達人
「創造性」とか「知能」とかそういうものをアレコレ仮説を立てるのは自由で楽しいですが、1学者が仮説段階で「絶対こうだ!」と断定し結論づけ他の見解を全否定する姿勢であるなら、
まず、本当にその測定方法は正しく、再現性を含めて多角的に検証し確認した上での結論ですか?ということと、あるいはそれらの豊富で確実な実験データに基づく説ですか?を問わなければならないでしょう。
しかし現実は、「ある説」が実験や検証を経ていても、そに恣意的な要素が含まれていることも観察されるわけです。
ところで、「有意差が認められた」という言葉をよく耳にしますが、今回、この表現を少し掘り下げてみましょう。
〇 帰無仮説: ある仮説が正しいかどうかの判断のために立てられる仮説
〇 有意水準: ある仮説を棄却するかしないかを決める基準の確率
〇 p値:有意確率
ここで補足として、『医療統計学」と「p値」に関する内容をわかりやすくまとめてある外部サイト記事を引用・紹介します。
「医療統計学の基礎≫p値とは?」 より引用抜粋
通常、P<0.05(5%未満)であれば、偶然性の影響による可能性は問題にならないほど小さい(結果は確実である)と解釈することになっている。統計学ではこれを「有意差がある」と表現する。
(中略)
検定の結果、P値が0.05以上であっても、有意差があることが実証されなかっただけであり、それだけで「違いがない」ことが結論づけられるわけではない。P値は「違いがない」という帰無仮説の確率指標であり、真実の値の評価値ではない。
(中略)
有意差はあくまで統計学的確率に基づいた判断であり、実際の臨床の場では臨床的意義も考慮して判断する必要がある。臨床上はごくわずかな差でも、統計学的には有意となることもあるからだ。– 引用ここまで- (続きは下記リンクより)
引用元⇒ 医療統計学の基礎≫p値とは?
「有意差」というのは「確率的に偶然とは考えにくい」という程度のものであって、「これは偶然ではない!」ということを断定できるような意味ではないんですね。
「統計的に有意な差」=「臨床的に意味のある差」ではない、「数学的に正しい ≠ 医学的に正しい」
ということです。
もうひとつ「効果量」に関して、以下の外部サイト記事を引用紹介します。
「有意差とは意味がある差なのか」 より引用抜粋
効果量(Effect Size)
効果の大きさ、関係性の強さを測るには効果量(Effect Size)を確認する必要があります。p値は効果の大きさを表しません。サンプルサイズが大きくなると、実質的な差が小さくても、p値が小さくなり有意となります。この仕組がある以上、p値という物差しでは、効果の大きさは測定できません。
(中略)
これに対して効果量は、帰無仮説が正しくない程度を表現する指標です。帰無仮説が正しい場合に、効果量は0になり、帰無仮説が誤っている(対立仮説は正しい)場合、効果量の絶対値も大きくなります。
(中略)
効果量が一定であっても、サンプルサイズが大きくなると、統計量は大きく(p値は減少)なります。また、サンプルサイズが一定であっても、効果量が大きくなると、統計量は大きく(p値は減少)なります。この式からも分かる通り、実質的に意味がない差であっても、サンプルサイズを大きくすれば、有意になります。
– 引用ここまで- (続きは下記リンクより)
引用元⇒ 有意差とは意味がある差なのか
もうひとつ追加更新(2018/8)で、心理学博士のツィートを以下に貼っていますが、統計って深くて難しいですね、でもこういう情報は一般の方は殆ど知らないと思うので、なかなか貴重な話だと思います。
科学者や専門家などが本やメディアで何やら科学的なことを語っているからといって、またその説の裏付けとして「統計的なエビデンス的なるもの」を提示しているからといって、
必ずしもそれが本当にシッカリしたエビデンスといえるのか、あるいは効果、再現性が高いのかどうかは、それだけではわからなかったりするんですね。
これ統計を使う人にとって重要かと思いますので、もう少し分かりやすい説明を試みます。近年、p値だけでなくCohen’s d などの「効果量」を示すことが推奨されてます。https://t.co/2nflV636y7
Cohen’s d https://t.co/wIbFd1LwNB は、2群の平均の差を標準偏差で割ったもの(差を正規化したもの)。 https://t.co/Y1GN4xkkAc— 何者でもないおっさん (@tsuyomiyakawa) 2018年8月14日
2019/4追加更新です。
宗教の教祖とはまた異なる「一般人には不可視化された学者の我田引水」、p値ハッキングとか発表バイアス、こういう「嘘」の部分を可視化した科学美を感じる図を貼っておきますね。これぞ「科学的に考察する者の仕事!」という感じですね。
科学者たちこそまずは「科学者たちのやっていること」「専門家それ自身」を科学していくことの必要性を感じますね。
心理学の7つの大罪 | クリス・チェインバーズ https://t.co/3KWWdAFr8Q repligate/replication crisis https://t.co/hax06vEIxU と呼ばれる心理学の有名な実験が再現不能であることに関する状況の整理(図の通り)と原因を追及した本の邦訳.HARK, p値ハッキング,発表バイアスなど相当根が深いです… pic.twitter.com/K0UdBQpSIe
— Yuta Kashino (@yutakashino) April 4, 2019
◇ 関連PDF/外部サイトの紹介
〇 統計にだまされるな
〇 標本や母集団などの、統計用語の説明
〇 関連の型――見かけ上の関連(spurious association)と非原因的関連(noncausal association)
まだ実証されていない個人の主張や見解なら、それを公的に絶対的な科学的事実かのように強弁して強引に普遍化することなど出来ないでしょう。
仮にある抽象的な理論が、哲学的・思想的な価値観での共感や納得がある場合であっても、そしてそれが精神的な支えにはなったとしても、まだ実証された事実ではない以上、実際的に現実の問題解決には繋がりません。
そしてある価値基準を持つ人にとって、それらの理論が精神的な支えや思想的共感を与えアイデンティティを補強する作用があっても、その範囲内では良い作用をもたらしているとはいえますが、
人間の心にせよ精神にせよ、単純化された論理で全て片付くようなものではなく、ましてそれを民族的な優位性に安直に結びつけたり、イデオロギーの補強に使うならば偏見の増長になるでしょう。
結局、事実に基づかずに価値判断に囚われるのであれば、自らの思考・創造性の範囲を固定化し、バイアスの強化に繋がります。
またそういう単純化されたモデルは、過去の精神医学の負の歴史や、科学者の暴走を生み出す力学のひとつにもなってきたわけで、
1天才学者や1専門家のもっともらしい仮説だけで「心」とか「意識」の全体が解明できた、とするような断定的な確信もまた、「思考停止していることそのもの」でもあるわけです。
まぁその辺の難しい話は科学者・専門家の誠実さに期待するとして、ここ最近の脳科学の技術と他の技術の組み合わせと応用には目覚ましいものがあり、驚くことばかりです。
例えば過去記事でもふれていますが、DecNef: デコーディッド ニューロフィードバックは最先端のニューロフィードバック技術で、「ファンクショナルMRI」で脳の活動を測定しつつ、恐怖の記憶を無意識のうちに消去することに成功し、
これは「オペラント条件付け」の応用版ですね。理論自体は新しいものではなく技術が画期的なんですね。「オペラント条件付け」やPTSDに関しては過去記事を参考にどうぞ。
〇 「条件付け」の科学的検証 強迫性障害(行動主義心理学・行動療法・認知行動療法)
ここまでくると、旧来のエクスポージャー系の行動療法の「苦痛」の過程を回避して、ダイレクトに脳にオペラント条件付けして「変容」させることも可能性として見えてきたので、今後はPTSDや強迫性障害の治療にどんどん応用化していくことが期待されるでしょう。
そして「恐怖条件付け」を変容するだけでなく、DecNefは「メタ認知」を変容する技術であるため、応用次第ではメタ認知の異常に関連する依存症や統合失調症、そしてうつ病や発達障害を含めた多様な精神疾患に応用も期待されます。⇒ [PDF]脳情報通信の応用に関する ATRの取り組み – 総務省
また、人工知能技術は「ケア」の面においても活用が期待されています。ビッグデータを人工知能で解析し認知症介護に役立てる研究が行われています。⇒ 認知症の人の暮らしをアシストする人工知能技術
このように現代の脳科学は過去の脳科学よりも飛躍的に進化してきています。様々な分野の技術と専門知の融合がそれを可能にしたんですね。
世界中の科学者たち・専門家たちの積み上げた知性の結晶、そしてエンジニアたちの技術力の結晶、その総合力が可能にする発見や進歩は素晴らしいです。決して「個人の力・個人の英知」だけで物事が全て解明されるわけではないんですね。
以下は過去記事でも紹介しましたが、「健康・医療情報の信頼性を検証する研究デザイン(方法)」を、「情報の信頼性が高いもの」・情報の偏りや偶然性が少ない」順番に上から並べたものです。
1 システマティックレビュー
2 ランダム化比較試験
3 非ランダム化比較試験
4 観察研究(比較群有:コホート研究・症例対照研究など)
5 観察研究(比較群無:症例報告など)
6 実験室の研究(細胞実験・動物実験)
7 経験談・権威者の意見
過去記事 ⇒ 疾患喧伝と精神医学 相関関係・因果関係と疑似科学
この中では7 経験談・権威者の意見は最も信頼度が低い、あるいは情報の偏りや偶然性が高いわけです。
「事実・真実それ自体」は、価値の優劣や印象とは無関係です。なので「真実かどうかはわからないが個人的には面白いと思う」、そんな程度のゆるい感覚くらいで十分でしょう。
実験や検証を通して、さらに他の角度からの科学的・専門的な批判や反証に耐え、現実での再現性が明確であるものがより普遍的な事実として受け入れられていくわけです。