薬学教育
Online ISSN : 2433-4774
Print ISSN : 2432-4124
ISSN-L : 2433-4774
誌上シンポジウム:学習成果を測る!インスティチューショナル・リサーチ(教学IR)の取り組み
医学教育におけるInstitutional Researchの分野別評価と内部質保証への関わり
―機関レベルと専門分野レベルのIR機能と関連性―
岡田 聡志
著者情報
ジャーナル フリー HTML

2018 年 2 巻 論文ID: 2018-012

詳細
Abstract

本稿では医学教育を1つの事例としながら,専門分野レベルのInstitutional Research(IR)の役割と機能について考察し,機関レベルのIRとの関連性を含め,今後の方向性について検討する.

具体的には,まず現在なぜ専門分野レベルのIRが注目されているかの背景について,内部質保証の強調,教育プログラムの第一義的重要性,分野別評価の導入と進展,機関別認証評価の軽量化の観点から整理する.次いで,事例としての医学教育におけるIRの展開について概観した上で,IRの形態の多様性について確認する.その上で,IRの具体的な機能に関連して,日本のIRに関する制約とその現状を指摘した上で,学修成果の測定や可視化に関する議論を確認しつつ,実践の在り方について論じる.最後に,専門分野レベルのIR機能の重要性を指摘するとともに,具体的な課題とともにその方向性を考察する.

課題設定

本稿の目的は,医学教育におけるInstitutional Research(以下,IRと略す)について,その背景や機能,議論について整理することを通じて,医学教育同様,専門職教育を1つの目的に持つ薬学教育におけるIRについて示唆を得ようとするものである.

IR自体は,既に多くで論じられているように,アメリカの高等教育に端緒を持ち,1960年代に専門職として確立し,その後諸外国・地域に波及していったという経緯を持つ.日本においては,2008年の中央教育審議会の「学士課程教育の構築に向けて」(審議のまとめ)で言及されたことを1つの契機に,2011年の大学ポートレート構想,2012年の大学間連携共同推進事業,2013年以降の私立大学等改革総合支援事業,2014年のスーパーグローバル大学創成支援などの政策や補助金などにより,高等教育システム全体としての政策誘導によって,推進されてきたといえる.

しかしながら,IRはそこに“Institution”が含まれていることから明らかなように,2014年の学校教育法改正による教授会の権限縮小と学長リーダーシップ強化に伴い,特に「機関」レベルでの意思決定支援としての役割が期待され,強調されてきた.このため,専門分野の教育とIRの関連性は,必ずしも十分に議論されておらず,その役割や機能についても不透明な状況が確認される.

このような状況について,本稿では医学教育を1つの事例としながら,専門分野レベルのIRの役割と機能について考察し,機関レベルのIRとの関連性を含め,今後の方向性について検討する.以下では,まず現在なぜ専門分野レベルのIRが注目されているかの背景について整理するとともに,事例としての医学教育におけるIRの展開について素描し,教育プログラムとIRの関連性を確認する.次いで,IRの具体的な機能に関連して,日本のIRに関する制約と現状を指摘した上で,学修成果の測定や可視化に関する議論を確認しつつ,実践の在り方について論じる.最後に,専門分野レベルのIR機能の重要性を指摘するとともに,具体的な課題とともにその方向性を考察する.

機関別認証評価の軽量化と内部質保証の強調

周知のとおり,2004年度から開始した機関別認証評価は2018年度より第3サイクルに入る.第1サイクルにおける法令や大学設置基準の遵守,第2サイクルにおける「成果」「効果」の強調1) や内部質保証システムの構築から,第3サイクルにおいては,内部質保証システムの「機能的有効性」に焦点が当たっている.

内部質保証は,「PDCAサイクル等の方法を適切に機能させることによって,質の向上を図り,教育・学習その他のサービスが一定水準にあることを大学自らの責任で説明・証明していく学内の向上的・継続的プロセス」 2) や「大学が自律的な組織として,その使命や目的を実現するために,自らが行う教育及び研究,組織及び運営,ならびに施設及び設備の状況について継続的に点検・評価し,質の保証を行うとともに,絶えず改善・向上に取り組むこと」 3) などと定義される.

この内部質保証がなぜ強調されるに至ったかについては,複数の理由が存在するが,質保証における教育プログラムの第一義的重要性の認識とともに,複数の専門領域における分野別評価の導入と進展,海外における機関別認証評価の動向などが影響したものと考えられる.

教育の質保証における教育プログラムの第一義的重要性については言うまでもなく,そもそも多くの大学で学部や学科別に独自の入試が行われ,そのために入学生が持つ背景や学力も異なり,機関や分野によって教育目標も,それに対応する教育内容や教育方法も,それを教える教員も,また,卒業後の進路も異なる状況の中で,一律に「大学」という名のもと,一定の基準をもとに教育の質保証を行うことは,論理的に困難であろう.教養教育などの市民性などの涵養を目的とした教育でさえも,同様の課題を内包しており,その点で,学士課程答申で言及された「学士力」も,分野横断的とはしつつも「できる限り汎用性があるものを提示するように努めた」21世紀型市民の内容に関する参考指針に過ぎず,実際の方針策定においては各大学の自主性・自律性が強調されていることは留意されるべきである.

それに関連して,2017年度からは学位プログラム注1)を基本とした三つのポリシーの策定・公表が学校教育法施行規則の改正により施行されたが,学士課程答申でも言及されていた分野別の質保証が近年進展しつつある.2001年のJABEE(日本技術者教育認定機構)に始まり,2008年のJABPE(薬学教育評価機構)の設立,2015年のJACME(日本医学教育評価機構)の設立や日本看護学教育評価機構(仮)の設置に向けた動き,あるいは2010年の日本学術会議による「大学教育の分野別質保証の在り方について」やそれに基づく「大学教育の分野別質保証のための教育課程編成上の参照基準」の策定,専門職を中心としたモデル・コア・カリキュラムの議論などは,専門分野別の質保証の動きの代表的な事例である.これに対応して2018年度以降の機関別認証評価では,内部質保証における教育プログラムを単位とする視点が強調されている3)

一方で,海外における機関別認証評価においては軽量化や負担軽減の動きが確認される.イギリスではQAA(The Quality Assurance Agency for Higher Education)による従来の高等教育レビューを廃止し,2016年から個々の高等教育機関の状況を反映し,かつ既存のデータ収集・分析を活用して受審機関の負担を軽減するリスクベース・アプローチを採用する新たな質保証制度を試行的に導入しているし,アメリカにおいても2016年に連邦教育省によってリスクベース・アプローチによる評価が奨励されている4,5).また,スペインやドイツ,オランダ,ベルギーにおいては,これまでのプログラム評価の蓄積を前提としながら,プログラム別の評価を廃止し,内部質保証を重視する方向性や評価の負担を軽減する制度に移行している6).他方で,専門職を中心としたプログラム評価については別の動きが見られるため,このことは必ずしも教育プログラムへの視点がなくなりつつあるということを意味するのではなく,その活動や蓄積を利用しながら,これまでの法令で定められた機関別認証評価を簡素化する動きであると理解され,機関が自律的に内部質保証システムを機能させ,それによって教育プログラムの質を保証するというその信頼性が評価される流れであるといえるだろう注2)

このように,近年の動向として,分野別評価や内部質保証を含め,機関そのものよりも教育プログラムへの焦点化が進展しており,このような中でIRの役割や機能についても,機関というよりはむしろ教育プログラムとの関係性の中で捉えられる傾向になりつつある.

医学教育におけるIRの展開

医学教育におけるIRは,2023年問題と表現されたように,アメリカの医師国家試験の受験資格審査団体であるECFMG(Educational Commission for Foreign Medical Graduates)による,2023年以降の受験資格を国際的な基準で認証された医学部出身者に限る,という通達に端を発した分野別評価の導入という強力な外圧のもと推進されたことは既に指摘されている通りである.文部科学省による大学改革推進事業の助成を受けて2013年度から実施されたトライアル評価やその事業の一環として行われた公開シンポジウムの中でも,度々IRの役割や必要性が言及されたことにより,分野別質保証の枠組みにおいても,IRの活用への期待が広がったといえる7)

国際基準として参照されることとなったWFME(World Federation for Medical Education)のグローバルスタンダードは,機関別認証評価とは異なる視点や基準が設定されていたため,新たな負担の純増に対し,その当初においては,認証評価の準備のすべてをIRに任せれば良いという誤った認識がなかったわけでもないが,トライアル評価が蓄積されるにつれて,IRは認証評価対応のためだけでなく,定常的に必要な機能として認識されていったといえる.特に,WFME基準で示されたプログラム評価(領域7)に係る基準においては,教員や学生,卒業生,患者や医療関係者など,様々なステークホルダーに対する調査やデータの収集・分析・報告が求められているため,この種の機能を担保するものとしてIRの導入を行った医学部も多く確認された.

このような状況で,医学教育においてはIRの導入が急速に進められたことにより,医学部独自にIRを設置する傾向が確認され,そのために必ずしも機関として内部でIRが体系的に整備されたという訳ではない.この点について,機関別認証評価の枠組みにおいて内部質保証が強調されていることを考えると,すべての教育プログラムでIRを設置するということは現実的ではないことから,今後機関としてどのようにIRの枠組みを整理・統合・棲み分けを図っていくか,機能としてのIRを保証していくかについては課題といえるだろう.

どのようなIRの形態が望ましいかという点についてアメリカの状況に目を移せば,アメリカにおいてもIRの形態は機関によって様々であることが指摘されている.J. Fredericks Volkweinは,アメリカにおけるIRの形態の類型を4つの観点から分類している8)表1は,それを簡略化して示したものであるが,1~2人の担当者が手作業的にIRを実施している「手工業的構造」もあれば,機能を焦点化した「アドホクラシー型」や1つの組織に集約した「専門職的官僚制」,研究大学に多い「分散組織型」に,IRの特徴を区別している.医学教育に関していえば,アメリカの場合はMedical Schoolであり,そもそもの制度が異なるため,一概に比較はできないが,各機関の状況に合わせてIRが機能する形態を整備する必要があるといえる.

表1 IR組織の類型8)
相対的に未発達・分散的 相対的に発達・集約的
相対的に小規模 手工業的構造
・5000人以下の機関に多い
 Ex. Oberlin Coll, Norwich U, Kellogg CC
アドホクラシー型
・米国北東部のIRの3割以上
 Ex. Seattle U, Lincoln U, Illinois Coll
相対的に大規模 分散組織型
・研究大学に多い
 Ex. UC Berkeley, Penn State, Harvard, Yale
専門職的官僚制
・4人以上の専門職
 Ex. U Penn, SUNY, Cal Poly

日本型IRの条件的制約

このような中でIRは,学内のデータを収集・分析・報告していく形で,内部質保証に貢献していくことが期待されているが,IRの担当者からは依然として,戸惑いの声が聞かれる.この点に関して,日本の大学におけるIRについては,中間団体の脆弱性と専門職の不在という条件的制約があることは指摘される必要があるだろう.

先述の通り,IRはアメリカの高等教育に端緒を持つため,その役割や機能はアメリカの高等教育システムの文脈に大きく依存しているし,また歴史的に変化してきたことが指摘されている9,10).また,エリート段階・マス段階・ユニバーサル段階という高等教育システムの発達段階について論じたMartin Trowはアメリカの高等教育システムの特徴を以下のように指摘している.

「中央で一元管理する機関もなく,共通の学問レベルの基準もないなかで,アメリカの高等教育を一つの「システム」にするにはどうすればよいかという問いに答えようとすると,〈中略〉アメリカの,ゆるやかに連結している高等教育システムは,無数の,あらゆる種類の団体に抱懐されることによって一つの形を与えられているのである.これらの団体は具体的にはたとえば学問分野の団体や,機関の種類ごとの団体や,職業団体や,運営主体の団体などである.〈中略〉まさにこれらの団体において,あるいは団体間で,命令するためではなく説得するために,議論と話し合いを継続していることが,アメリカの全国的高等教育「システム」という組織の存立の根源なのである.」 11)

このように個々の大学と政府の間にあり,利害や役割を調整したり,個別機関の範囲を超えた業界全体の利益を追及したり,情報交換や相互扶助,政策形成等にも寄与する中間団体の役割は,アメリカの高等教育システムの特徴の1つであると考えられるが,日本においてはこの中間団体の役割が脆弱であることが,これまでも指摘されてきた12,13).2007年のシンポジウムで天野郁夫は,日本の大学に関する中間団体の現状を「親睦団体的な性格が強い」と評するとともに,その要因を「タテの統制が強いために,ヨコの連携が育たない.大学は国家との距離を意識するばかりで,隣の,他の大学との関係を意識しない」と言及している14).2008年の学士課程答申でも「大学団体等の役割・機能」について「中間団体への役割への期待は増大(先進諸国共通の傾向)」と言及されているが,その機能や役割は依然発展途上の段階であると考えられる.

このことと合わせて大学に関する専門職と専門職団体の存在も,アメリカの高等教育システムの特徴の1つである.IRの専門職団体であるAIR(Association for Institutional Research)は1966年に設置され,職能開発や情報の共有,倫理綱領の策定などに大きな役割を果たしている.それ以外にも学生担当の専門職団体であるACPA(American College Personnel Association)やNASPA(National Association of Student Personnel Administrators),アカデミック・アドバイジングに関する専門職団体であるNACADA(National Academic Advising Association)など,様々な専門職が存在し,活動を行っている.

これらの中間団体や専門職が,どのようにIRに関連するかといえば,IRの専門職団体であるAIRを除いても,例えばアメリカの医学教育においてはAAMC(Association of American Medical Colleges)が積極的な活動を行っており,入学生(MSQ:Matriculating Student Questionnaire)や卒業時の調査(GQ:Medical School Graduation Questionnaire)などを実施し,学校別・キャンパス別の集計結果をフィードバックしているほか,Medical Schoolへの出願システムであるAMCASや入試としてのMCAT,レジデントの出願システムであるERASなど,を運営している.

また,入試担当の専門職団体であるNACAC(National Association for College Admission Counseling)の調査によれば,回答機関のうち約半数が入試の妥当性の検討を行っており,その内のまた半数が毎年実施していると回答しているが,その実施個所はIR担当組織が多くを占めるとされる.入試の予測的妥当性に関する機能は,医学教育に関していえば,WFME基準のQ7.3.2の「入学時成績」と「学生と卒業生の実績」の分析に関連するものである.この種の検討は,大半(約8割)は機関独自に実施していると回答しているが,分析枠組みについては独自のものを採用しているというよりは,College BoardのACES(Admitted Class Evaluation Service)の枠組みが多くで使用されていることが指摘されている15)

College Boardは,アメリカの大学入試で利用されるSATをはじめ,様々な標準テストの開発や高等教育への接続を支援する組織として1900年に設立された歴史を有する非営利組織であるが,ACESはそのCollege Boardが提供する無料の入試データ分析サービスである.各機関は,ACESに学生のデータを提供することで,社会保障番号(SSN)と紐づけられ,その分析結果が約1か月後に提供される.このデータ共有は,家庭教育権とプライバシー法(FERPA:Family Educational Rights and Privacy Act)に基づくもので,試験の開発・妥当化・管理運営,学生支援プログラムの管理運営,教育改善などの目的については,同意なしの情報開示が認められている(34 CFR 99.31(a)(6)(i))ことで可能になっている.

このとき,使用される変数は,予測の基準としては大学の初年次のGPAが採用されており,SATの得点(領域別)や高校内順位,優等課程やアドバンスト・プレイスメント科目注3)の履修数などとの関連性が分析される.入試の予測的妥当性に関しては,入試成績のデータはすべての対象のものがあるが,大学入学後の成績は入試の合格者のものしかなくデータが切断されているという,「選抜効果」への対応が必要になってくるが,これについては補正された相関係数が報告される16)

先のNACACの調査から判断すれば,ACES自体を利用して入試の予測的妥当性の検討を行っている機関は多くはないが,この種の取り組みが分析方法や使用する変数等を公開することにより,ある種の専門性を担保しながら,IRが実施する分析の標準性を形成していると考えることができる.

このようにアメリカにおけるIRの役割と機能については,中間団体や専門職の関与が確認される.現状として日本のIRはそういった基盤や条件なしに,活動が求められていることについては,注意が必要であろう.

「学修成果」の「測定」とIRの関わり

IRが教育プログラムの質保証に対して貢献していくためには,教育プログラムの実態を踏まえたデータの収集・分析・報告が求められる.取り扱うデータについても,医学教育の場合においては,共用試験のCBTやOSCE,Post-CC OSCE,医師国家試験の合否や得点など,専門分野固有のものも多い.分析の視点としても,卒後の研修や生涯学習を含めた医師の能力開発への連続性や一貫性が求められる.その点は「学修成果」についても同様であろう.

「学修成果」の「測定」や「可視化」については,近年大きな議論となっており,様々な機関や教育プログラムにおいて,多様なアプローチがなされているが,まず前提としてそれは設定された教育目標の妥当性や適切性とは区別される必要がある.学習者中心への転換の名のもとに,何を教えたかではなく,何ができるようになったか,“teaching”から“learning”へなどと喧伝される動きもあるが,素朴な管理・注入主義のもと主体-客体関係に立とうと,主体-主体関係の相互作用として教育的行為を見ようと,学習が目標との対応関係で意図的・目的的に実施されるのであれば,何ができるかは設定された目標に既に示されており,測定はそれに従属する.

医学教育に関していえば,薬学教育と同様に,卒業時の到達目標を示した「医学教育モデル・コア・カリキュラム」が公表されており,それを標準としながら,機関独自の教育プログラムとしての特色も一部では含まれるであろうが,基本的には何ができるかという「学修成果」は,教育目標として既に設定されているものである.

教育目標自体については,コンピテンシーにしても具体的な活動を規準としたEPAs(Entrustable Professional Activities)にしても,「良い医師」を前提に,目標が設定されている訳で,社会的要請や時代の変化とともにその「良い医師」像が変化し,教育目標も変化すること自体は避けられないことではあるが,その妥当性の議論と「測定」の議論はまず区別される必要がある.

その上で,学修成果はこれまで「測定」されてこなかったかといえば,決してそうではなく,教育として実施される授業の成績評価として,その目標への到達度が本来的には測定されてきたはずである.しかしながら,ここまで「学修成果」の「測定」や「可視化」が議論になるのは,それらの営為に対する不信感が社会に存在するためであろう.

この点について,金子元久は「個々の授業が実際にどのような内容を伝えるかは,ほぼ個々の教員に任されていて,教員間に明確な共通理解があるわけではない.あるいはそれらを集積した学習経験がどのような教育成果を形成するかについても,それについての一定の暗黙の期待があるものの,それがどのような過程を通じて形成されるかが明示されることはほとんどなく,また実際に検証されることもない」17) と表現している.このことは,授業や教育がブラックボックスであることとともに,資質・能力の形成の方法やその評価についての研究蓄積の薄さを指摘している.

そうであるならば,確認されなければならないのは,授業において教育プログラムの観点から教育目標が適切に設定されているか,教育目標に対応した内容が教育されているか,その教育目標を達成するために有効な教育方法が採用されているか,教育目標に対応した教育評価がなされているか,という点であり,どのように授業や教育の外側からその適切性を評価するかという視点とともに,教育研究や教育開発の視点も重要となってくる.後者については,その視点がWFME基準において,学生の評価方法に関する「必要に合わせて新しい評価法を導入すべきである(Q3.1.2)」という基準や「教職員は教育的な研究を遂行すべきである(Q6.5.3)」などの基準に反映されていることも確認される.

しかしながら,現状として研究蓄積が薄い以上,これらの活動は容易ではない.それぞれの教育目標に対してどの教育方法や教育測定が適切かについては,研究するとしても様々な要因が交絡するし,条件を統制する「実験」も実現可能性が低いため,そもそも研究デザインが難しく,一部の研究成果もその信頼性とともに,外的妥当性が問題になってくる.

例えば,コンピテンシーなどの教育目標と授業科目の対応関係を一覧化したカリキュラム・マップを作成した上で,卒業時にある教育目標について学生の自己評価あるいは何かしらの客観評価の値が低かった場合でも,その要因としては,カリキュラム自体である場合もあれば,授業の方法や内容である場合もあるし,例えば,国家試験がその教育目標に対応する資質・能力を対象としていないため,相対的に値が低くなるといった制度的・構造的なものであったり,測定用具としての自己評価や客観評価自体の問題であったりということも考えられる.

このような困難を忌避し安直さを求めれば,資格領域の専門分野は資格試験の合格率のような短絡的な指標に流れかねない.しかし,パフォーマンス評価の重要性が指摘される中で,例えば医師国家試験の役割はあくまで一面に過ぎないし,その受験資格が「学校教育法に基づく大学において,医学の正規の課程を修めて卒業した者」とされているように,本来,教育プログラムとしての医学教育は医師国家試験受験のための必要条件のはずである.この意味で正課が単なる国家試験対策に割かれていないか,医師として必要な知識や技能についての教育や評価が適切に実施されているかどうかは内部質保証の観点からも省みられる必要がある.

就職率や国家試験の合格率あるいは一部で導入される標準テストなども,絶対的な基準になり得ない以上,「学修成果」の「測定」や「可視化」も,それに基づいた教育改善も試行錯誤にならざるを得ない.その点で,IRは,教育研究や教育開発,FD(Faculty Development)やSD(Staff Development)と連携・連動しながら,教育の営為を明らかにしていく一連のプロセスとして理解されるべきであろう.

まとめ

以上,本稿では,医学教育を1つの足掛かりに,専門分野の教育としての教育プログラムとIRの役割と機能について,その背景や機能,議論について整理を行った.そこから得られる示唆として,次の2点が挙げられる.

1つは,IRやそれに関係する教育研究や教育開発,あるいはFD・SDなどを共有していく枠組みの必要性である.日本のIRにおける条件的制約として中間団体の脆弱性や専門職の不在は指摘した通りであるが,それらが担っている機能をどのように担保するかが重要になってくる.この点で,各専門領域別の教育学会の活動やそこでの情報の共有に期待はされるが,研究倫理も含め,そもそも研究と業務として実施されるIRとは同一視できない部分もあり,それらをどのように考えていくかは課題であろう.

もう1つは,教職員の問題意識の重要性である.IRが報告するデータや分析結果が絶対的なものでなく,様々な限界があることを指摘したが,そうである以上,IRの活動自体も議論や対話を中心としながら進める必要がある.その点で個々の教職員に授業や教育プログラムについての問題意識や関心がなければ,改善という視点を持つことも困難である.教育プログラムの質保証に対して効果的なIRを構築するためには,そのような認識を醸成・共有していくことが重要であると考えられる.

1)  本稿では「学位プログラム」を「教育プログラム」の一つの形態として取り扱う.

2)  この点について,イギリスの大学評価の近年の動向について論じた林隆之は,日本におけるリスクベース・アプローチの導入について,「質保証や評価を支える体制が日本は圧倒的に脆弱である.たとえば,日本では大学内部におけるプログラム単位の質保証は今後の課題であり,そのため外部質保証もリスクベース・アプローチにすぐには移行しにくい」 18) と論じている.

3)  アドバンスト・プレイスメント科目とは「大学の一般教育(general education)科目に相当する科目を,高校教員が高校で高校生を対象に提供するプログラム」 19) と説明される.

謝辞

本研究の一部は,JSPS科研費JP 25870134JP,16K04602の助成を受けたものである.

発表内容に関連し,開示すべき利益相反はない.

文献
 
© 2018 日本薬学教育学会
feedback
Top