[go: up one dir, main page]

JP7290272B2 - Ability measuring device, program and method - Google Patents

Ability measuring device, program and method Download PDF

Info

Publication number
JP7290272B2
JP7290272B2 JP2019112144A JP2019112144A JP7290272B2 JP 7290272 B2 JP7290272 B2 JP 7290272B2 JP 2019112144 A JP2019112144 A JP 2019112144A JP 2019112144 A JP2019112144 A JP 2019112144A JP 7290272 B2 JP7290272 B2 JP 7290272B2
Authority
JP
Japan
Prior art keywords
ability
adaptive test
initial
item
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019112144A
Other languages
Japanese (ja)
Other versions
JP2020204703A (en
Inventor
幸謙 尾▲碕▼
直弥 登藤
真一郎 歌川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tsukuba NUC
Original Assignee
University of Tsukuba NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tsukuba NUC filed Critical University of Tsukuba NUC
Priority to JP2019112144A priority Critical patent/JP7290272B2/en
Publication of JP2020204703A publication Critical patent/JP2020204703A/en
Application granted granted Critical
Publication of JP7290272B2 publication Critical patent/JP7290272B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

特許法第30条第2項適用 平成30年9月3日「日本行動計量学会 第46回大会 抄録集」にて発表 Article 30, Paragraph 2 of the Patent Law applies September 3, 2018 Announced at the 46th Annual Meeting of the Japan Society of Behaviormetrics Abstracts

特許法第30条第2項適用 平成30年9月4日「日本行動計量学会 第46回大会」にて発表 Application of Article 30, Paragraph 2 of the Patent Act September 4, 2018 Announced at the 46th Annual Meeting of the Japan Behaviormetric Society

特許法第30条第2項適用 平成30年9月5日「日本テスト学会第16回大会 発表論文抄録集、第48頁・第49頁」にて発表 Application of Article 30, Paragraph 2 of the Patent Law Published on September 5, 2018 at the 16th Conference of the Japan Society for Testing, Abstracts of Presentations, pp. 48 and 49

特許法第30条第2項適用 平成30年9月9日「日本テスト学会第16回大会」にて発表Application of Article 30, Paragraph 2 of the Patent Law September 9, 2018 Announced at the 16th Annual Meeting of the Japan Testing Society

本発明は、受検者の複数の能力を測定するための能力測定装置、プログラム、及び方法に関する。 The present invention relates to an ability measuring apparatus, program, and method for measuring multiple abilities of examinees.

コンピュータを利用して行うテスト(Computer-based testing:CBT)の一例として、適応型テスト(Computerized adaptive testing:CAT)がある。 Computerized adaptive testing (CAT) is an example of computer-based testing (CBT).

適応型テストは、項目反応理論(Item response theory:IRT)を用いて受検者の回答パターンに応じて適した項目を選択し、選択された項目が受検者へ提示される。 The adaptive test uses item response theory (IRT) to select appropriate items according to the test subject's response pattern, and the selected items are presented to the test subject.

適応型テストでは、テストの採点を瞬時かつ自動で行うことができ、異なるテストを同一尺度で評価可能である。また、適応型テストでは、紙面上でのテスト(Paper-based testing:PBT)と比べて少ない項目数で受検者の能力を測定可能である。 With adaptive testing, test scoring is instantaneous and automatic, and different tests can be graded on the same scale. In addition, the adaptive test can measure the examinee's ability with a smaller number of items than paper-based testing (PBT).

Joel M. Brown & David J. Weiss(1977). An Adaptive Testing Strategy for Achievement Test Batteries. Research Report 77-6. Minnesota Univ., Minneapolis. Dept. of Psychology.Joel M. Brown & David J. Weiss(1977). An Adaptive Testing Strategy for Achievement Test Batteries. Research Report 77-6. Minnesota Univ., Minneapolis. David J. Weiss(2004). Computerized Adaptive Testing for Effective and Efficient Measurement in Counseling and Education. Measurement and Evaluation in Counseling and Development, 37(2) 70-84.David J. Weiss(2004). Computerized Adaptive Testing for Effective and Efficient Measurement in Counseling and Education. Measurement and Evaluation in Counseling and Development, 37(2) 70-84. Daniel O. Segal(1996). Multidimensional Adaptive Testing. Psychometrika, 61(2), 331-354.Daniel O. Segal (1996). Multidimensional Adaptive Testing. Psychometrika, 61(2), 331-354. van der Linden, W. J.(1999). Multidimensional adaptive testing with a minimum errorvariance criterion, Journal of Educational and Behavioral Statistics, 24(4), 398-412.van der Linden, W. J.(1999). Multidimensional adaptive testing with a minimum errorvariance criterion, Journal of Educational and Behavioral Statistics, 24(4), 398-412. Mulder, J., & van der Linden, W. J.(2009). Multidimensional adaptive testing with optimal design criteria for item selection, Psychometrika, 74(2), 273-296.Mulder, J., & van der Linden, W. J. (2009). Multidimensional adaptive testing with optimal design criteria for item selection, Psychometrika, 74(2), 273-296.

特開2004-46255号公報JP-A-2004-46255 特開2005-215023号公報JP-A-2005-215023

複数の能力のそれぞれに関して受検者に複数の項目を提示し、回答を収集し、受検者の複数の能力を測定する場合、受検者に提示される項目数及び回答の収集に必要な時間を減らし、効率よくかつ精度よく測定を行うことが望ましい。 Reduce the number of items presented to test-takers and the time required to collect responses when multiple items are presented to test-takers for each of multiple competencies, responses are collected, and multiple competencies are measured. , it is desirable to perform measurements efficiently and accurately.

本発明は、上記事情に鑑みてなされており、複数の能力を効率よくかつ精度よく測定するための能力測定装置、プログラム、及び方法を提供する。 The present invention has been made in view of the above circumstances, and provides an ability measuring apparatus, program, and method for efficiently and accurately measuring a plurality of abilities.

本発明の実施形態によれば、能力測定装置は、記憶装置と処理装置とを含む。記憶装置は、複数の能力の測定に用いられる複数の項目を含む項目データを記憶する。処理装置は、項目データを用いて、複数の能力のそれぞれに関する適応型テストを実行する。複数の能力は、第1の能力と、第1の能力より後に測定される第2の能力と、第2の能力より後に測定される第3の能力とを含む。処理装置は、第1の能力に対する第1の適応型テストの第1の最終推定値に基づいて、第2の能力に対する第2の適応型テストの初期項目を選択し、第2の適応型テストの能力推定で用いられる事前分布を決定し、第2の適応型テストの第2の最終推定値に基づいて、第3の能力に対する第3の適応型テストの初期項目を選択し、第3の適応型テストの能力推定で用いられる事前分布を決定する。処理装置は、第1の最終推定値と第1の回帰式とに基づいて、第2の適応型テストの初期推定値を算出し、第2の適応型テストの初期推定値に基づいて、第2の適応型テストの初期項目を選択し、第2の最終推定値と第2の回帰式とに基づいて、第3の適応型テストの初期推定値を算出し、第3の適応型テストの初期推定値に基づいて、第3の適応型テストの初期項目を選択する。処理装置は、第2の適応型テストの初期推定値を平均値とし、第1の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を、第2の適応型テストの能力推定で用いられる事前分布とし、第3の適応型テストの初期推定値を平均値とし、第2の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を、第3の適応型テストの能力推定で用いられる事前分布とする。 According to an embodiment of the invention, a performance measuring device includes a storage device and a processing device. A storage device stores item data including a plurality of items used for measuring a plurality of abilities. The processing unit uses the item data to perform adaptive tests for each of the plurality of competencies. The plurality of competencies includes a first competencies, a second competencies measured after the first competencies, and a third competencies measured after the second competencies. The processor selects initial items for a second adaptive test for a second ability based on a first final estimate of the first adaptive test for the first ability, and performs a second adaptive test. determine the prior distribution used in the proficiency estimation of , select initial items for a third adaptive test for the third proficiency based on the second final estimate of the second adaptive test, and select a third Determine the priors used in adaptive test ability estimation. The processing unit calculates an initial estimate for the second adaptive test based on the first final estimate and the first regression equation, and calculates a first estimate based on the initial estimate for the second adaptive test. Select the initial item of the second adaptive test, calculate the initial estimate of the third adaptive test based on the second final estimate and the second regression equation, and calculate the initial estimate of the third adaptive test Based on the initial estimates, select initial items for the third adaptive test. The processing device calculates the prior distribution with the mean value as the initial estimated value of the second adaptive test and the standard deviation as the standard error of the prediction error of the objective variable in the first regression equation, and the ability of the second adaptive test. The prior distribution used in the estimation, the initial estimated value of the third adaptive test as the mean value, and the standard error of the prediction error of the objective variable in the second regression equation as the standard deviation is the prior distribution used in the third adaptive test Let it be the prior distribution used in proficiency estimation for the type test.

本発明によれば、複数の能力を効率よくかつ精度よく測定することができる。 According to the present invention, it is possible to efficiently and accurately measure a plurality of abilities.

第1の実施形態に係る能力測定装置の一例を示すブロック図。1 is a block diagram showing an example of a performance measuring device according to a first embodiment; FIG. 第1の実施形態に係る能力測定処理の一例を示すフローチャート。4 is a flowchart showing an example of ability measurement processing according to the first embodiment; 第2の実施形態に係る能力測定処理の一例を示すフローチャート。10 is a flowchart showing an example of ability measurement processing according to the second embodiment; 項目特性曲線の例を示すグラフ。A graph showing an example of an item characteristic curve.

以下、図面を参照して、発明の実施形態について説明する。以下の説明において、同一の部分又は実質的に同一の部分には同じ参照符号を付して説明を省略するか、又は、簡単に説明を行う。 Hereinafter, embodiments of the invention will be described with reference to the drawings. In the following description, the same or substantially the same parts are denoted by the same reference numerals and their descriptions are omitted or briefly described.

(第1の実施形態)
本実施形態に係る能力測定装置は、受検者の複数の能力(あるいは特性)を測定するため、複数の能力のそれぞれに関して、複数の項目を選択し、受検者へ提示し、複数の項目に対する回答(あるいは、反応又は解答)を収集する。
(First embodiment)
In order to measure a plurality of abilities (or characteristics) of an examinee, the ability measuring apparatus according to the present embodiment selects a plurality of items for each of the plurality of abilities, presents them to the examinee, and provides answers to the plurality of items. (or responses or answers) are collected.

本実施形態においては、n-1番目(nは2以上の整数)に実行された第n-1の適応型テストの結果(第n-1の能力の推定値)とn番目に実行される第nの適応型テストの結果(第nの能力の推定値)との間の相関が所定レベルよりも強い場合に、第n-1の適応型テストの結果に基づいて、第nの適応型テストで用いられる初期項目及び事前分布を選択及び決定する。
なお、本実施形態に係る能力測定装置は、第n-1の能力の推定値と第nの能力の推定値との間の相関係数がゼロでなければ、有効な測定を実施可能である。通常、2つの能力の推定値は正の相関を持つと考えられる。しかしながら、本実施形態に係る能力測定装置は、2つの能力の推定値が負の相関を持つ場合に適用されてもよい。
In this embodiment, the result of the n-1th adaptive test (n-1th ability estimate value) executed n-1th (n is an integer of 2 or more) and the n-th executed If the correlation between the result of the nth adaptive test (estimated value of the nth ability) is stronger than a predetermined level, based on the result of the n−1th adaptive test, the nth adaptive test Select and determine the initial terms and priors used in the test.
Note that the ability measuring device according to the present embodiment can perform effective measurement if the correlation coefficient between the n−1th ability estimate value and the nth ability estimate value is not zero. . Usually, the two performance estimates are considered to be positively correlated. However, the ability measuring device according to the present embodiment may be applied when two ability estimates have a negative correlation.

本実施形態の具体例では、説明を簡略化するために、3つの能力を測定する場合を説明するが、2つの能力を測定する場合及び4つ以上の能力を測定する場合も同様である。 In the specific example of this embodiment, the case of measuring three abilities will be described for the sake of simplification, but the same applies to the case of measuring two abilities and the case of measuring four or more abilities.

図1は、本実施形態に係る能力測定装置1の構成の一例を示すブロック図である。 FIG. 1 is a block diagram showing an example of the configuration of a performance measuring device 1 according to this embodiment.

能力測定装置1は、受検者の第1乃至第3の能力を測定する。本実施形態では、まず、第1の能力が測定され、第1の能力より後に第2の能力が測定され、第2の能力より後に第3の能力が測定される。 The ability measuring device 1 measures the first to third abilities of an examinee. In this embodiment, the first ability is measured first, the second ability is measured after the first ability, and the third ability is measured after the second ability.

能力測定装置1は、第1の能力に対する第1の適応型テストを実行する。第1の適応型テストでは、第1の初期項目が選択され、能力推定で第1の事前分布が用いられる。 The ability measuring device 1 performs a first adaptive test for a first ability. In a first adaptive test, a first initial item is selected and a first prior distribution is used in ability estimation.

能力測定装置1は、第1の能力に対する第1の適応型テストの第1の最終推定値に基づいて、第2の能力に対する第2の適応型テストの第2の初期項目を選択し、第2の適応型テストの能力推定で用いられる第2の事前分布を決定する。第2の適応型テストでは、第2の初期項目が用いられ、能力推定で第2の事前分布が用いられる。 The ability measuring device 1 selects a second initial item of a second adaptive test for a second ability based on a first final estimate of the first adaptive test for the first ability, Determine a second prior distribution to be used in performance estimation for the adaptive test of 2. A second adaptive test uses a second initial item and a second prior distribution in ability estimation.

能力測定装置1は、第2の能力に対する第2の適応型テストの第2の最終推定値に基づいて、第3の能力に対する第3の適応型テストの第3の初期項目を選択し、第3の適応型テストの能力推定で用いられる第3の事前分布を決定する。第3の適応型テストでは、第3の初期項目が用いられ、能力推定で第3の事前分布が用いられる。 The ability measuring device 1 selects a third initial item of a third adaptive test for a third ability based on a second final estimate of the second adaptive test for the second ability, Determine the third prior distribution used in performance estimation for the adaptive test of 3. A third adaptive test uses a third initial term and a third prior distribution in ability estimation.

能力測定装置1は、例えば、入力装置2、出力装置3、記憶装置4、処理装置5を備える。入力装置2、出力装置3、記憶装置4、処理装置5は、例えばバス6などを介して、互いにデータを送受信可能である。能力測定装置1は、複数の情報処理装置が連携動作することにより実現されてもよい。例えば、能力測定装置1は、クライアントとサーバとから構成されるネットワークシステムにより構築されてもよい。 The ability measuring device 1 includes an input device 2, an output device 3, a storage device 4, and a processing device 5, for example. The input device 2, the output device 3, the storage device 4, and the processing device 5 can transmit and receive data to and from each other via a bus 6, for example. The ability measuring device 1 may be implemented by a plurality of information processing devices working together. For example, the performance measuring device 1 may be constructed by a network system composed of a client and a server.

入力装置2は、例えば、キーボード、ポインティングデバイス、受信装置などであり、各種コマンド、指令、受検者の回答などを受け付け、又は、受信する。 The input device 2 is, for example, a keyboard, a pointing device, a receiving device, etc., and accepts or receives various commands, instructions, responses from examinees, and the like.

出力装置3は、例えば、ディスプレイ、スピーカ、又は、送信装置などであり、項目、受検者の複数の能力の測定結果などの各種データを表示、音出力、又は、送信する。 The output device 3 is, for example, a display, a speaker, a transmission device, or the like, and displays, outputs sound, or transmits various data such as measurement results of multiple abilities of the test subject.

記憶装置4は、処理装置5によって実行される各種処理に必要な各種データを記憶する。本実施形態の例において、記憶装置4は、例えば、プログラム7、項目プール8、回答データ9、推定データ10、第1乃至第3の能力測定データ111~113、第1及び第2の回帰モデル121、122、初期項目データ13a、13b、事前分布データ14a、14bなどを記憶する。記憶装置4に記憶されている各種のデータは、適宜、分割し、又は、組み合わせてもよい。具体的には、例えば、推定データ10と第1乃至第3の能力測定データ111~113とは、組み合わせてもよい。記憶装置4は、例えば、不揮発性ストレージデバイスを含むとしてもよく、例えば、キャッシュメモリなどのような一時記憶媒体を含むとしてもよい。 The storage device 4 stores various data necessary for various processes executed by the processing device 5 . In the example of this embodiment, the storage device 4 includes, for example, a program 7, an item pool 8, answer data 9, estimated data 10, first to third ability measurement data 111 to 113, first and second regression models 121, 122, initial item data 13a, 13b, prior distribution data 14a, 14b, etc. are stored. Various data stored in the storage device 4 may be divided or combined as appropriate. Specifically, for example, the estimated data 10 and the first to third ability measurement data 111 to 113 may be combined. Storage device 4 may include, for example, non-volatile storage devices, and may include temporary storage media such as cache memory, for example.

プログラム7は、処理装置5に実行されることにより、受検者の複数の能力を効率よくかつ精度よく測定するための機能を実現する。このプログラム7によって実行される本実施形態に係る能力測定処理の詳細は後述する。 The program 7, when executed by the processing device 5, realizes a function for efficiently and accurately measuring a plurality of abilities of the examinee. The details of the ability measurement process according to the present embodiment executed by this program 7 will be described later.

項目プール8は、第1乃至第3の適応型テストで利用される項目の集合を含むデータである。 The item pool 8 is data containing a set of items used in the first to third adaptive tests.

回答データ9は、受検者に対して提示された複数の項目のそれぞれに対する受検者の回答と、回答に関する正誤データを含む。 The answer data 9 includes the examinee's answers to each of the plurality of items presented to the examinee and correct/wrong data regarding the answers.

推定データ10は、適応型テストにおける能力推定によって算出される推定値を含む。本実施形態においては、この推定データ10に含まれる推定値に基づいて、受検者に対して次に提示すべき項目が選択される。 Estimated data 10 includes estimated values calculated by performance estimation in adaptive testing. In this embodiment, based on the estimated values contained in the estimated data 10, items to be presented next to the examinee are selected.

第1乃至第3の能力測定データ111~113のそれぞれは、第1乃至第3の能力を測定するための第1乃至第3の適応型テストで算出された最終推定値を含む。 Each of the first through third ability measurement data 111-113 includes the final estimates calculated in the first through third adaptive tests for measuring the first through third abilities.

第1の回帰モデル121は、第1の能力測定データ111に基づいて第2の能力の測定で用いられる第2の初期項目を選択するために用いられる式、データ、又は、プログラムを含む。 First regression model 121 includes formulas, data, or programs used to select a second initial item to be used in a second performance measure based on first performance measurement data 111 .

さらに、第1の回帰モデル121は、第1の能力測定データ111に基づいて第2の適応型テストにおける能力推定で用いられる第2の事前分布を決定するために用いられる式、データ、又は、プログラムを含む。 Further, the first regression model 121 may be a formula, data, or Including program.

より具体的に説明すると、第1の回帰モデル121は、第1の能力測定データ111に基づいて第2の初期項目を選択するための第1の回帰式を含む。第1の回帰式は、第1の能力の能力値を説明変数とし、第2の能力の能力値を目的変数とする。第1の回帰式に、第1の能力の最終推定値を代入することにより、第2の能力の初期推定値が算出され、第2の能力の初期推定値に対応する第2の初期項目が選択される。 More specifically, first regression model 121 includes a first regression equation for selecting a second initial item based on first performance measurement data 111 . The first regression formula uses the ability value of the first ability as an explanatory variable and the ability value of the second ability as an objective variable. An initial estimate of the second ability is calculated by substituting the final estimate of the first ability into the first regression equation, and a second initial item corresponding to the initial estimate of the second ability is selected.

また、第1の回帰モデル121は、第2の能力の初期推定値を平均とし、第1の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を決定するための情報を含む。 In addition, the first regression model 121 has the information for determining the prior distribution with the initial estimated value of the second ability as the mean and the standard error of the prediction error of the objective variable in the first regression equation as the standard deviation. include.

第2の回帰モデル122は、第2の能力測定データ112に基づいて第3の能力の測定で用いられる第3の初期項目を選択するために用いられる式、データ、又は、プログラムを含む。 Second regression model 122 includes formulas, data, or programs used to select a third initial item for use in a third performance measure based on second performance measurement data 112 .

さらに、第2の回帰モデル122は、第2の能力測定データ112に基づいて第3の適応型テストにおける能力推定で用いられる第3の事前分布を決定するために用いられる式、データ、又は、プログラムを含む。 Further, the second regression model 122 may be a formula, data, or Including program.

より具体的に説明すると、第2の回帰モデル122は、第2の能力測定データ112に基づいて第3の初期項目を選択するための第2の回帰式を含む。第2の回帰式は、第2の能力の能力値を説明変数とし、第3の能力の能力値を目的変数とする。第2の回帰式に、第2の能力の最終推定値を代入することにより、第3の能力の初期推定値が算出され、第3の能力の初期推定値に対応する第3の初期項目が選択される。 More specifically, second regression model 122 includes a second regression equation for selecting a third initial item based on second performance measurement data 112 . The second regression formula uses the ability value of the second ability as an explanatory variable and the ability value of the third ability as an objective variable. By substituting the final estimate of the second ability into the second regression equation, the initial estimate of the third ability is calculated, and the third initial item corresponding to the initial estimate of the third ability is selected.

また、第2の回帰モデル122は、第3の能力の初期推定値を平均とし、第2の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を決定するための情報を含む。 In addition, the second regression model 122 has information for determining a prior distribution with the initial estimated value of the third ability as the mean and the standard error of the prediction error of the objective variable in the second regression equation as the standard deviation. include.

初期項目データ13aは、第2の適応型テストで用いられる第2の初期項目を示すデータである。 The initial item data 13a is data indicating the second initial items used in the second adaptive test.

初期項目データ13bは、第3の適応型テストで用いられる第3の初期項目を示すデータである。 The initial item data 13b is data indicating the third initial item used in the third adaptive test.

事前分布データ14aは、第2の適応型テストにおける能力推定で用いられる第2の事前分布を示すデータである。 The prior distribution data 14a is data representing a second prior distribution used for ability estimation in the second adaptive test.

事前分布データ14bは、第3の適応型テストにおける能力推定で用いられる第3の事前分布を示すデータである。 The prior distribution data 14b is data representing a third prior distribution used for ability estimation in the third adaptive test.

処理装置5は、記憶装置4に記憶されているプログラム7を実行し、制御部15、第1乃至第3の能力測定部161~163、初期項目選択部17、事前分布決定部18として機能する。なお、制御部15、第1乃至第3の能力測定部161~163、初期項目選択部17は、適宜、分割し、又は、組み合わせてもよい。具体的には、例えば、第1乃至第3の能力測定部161~163は、第1の能力から第3の能力までを測定可能な共通の能力測定部としてもよい。例えば、初期項目選択部17は、第2の初期項目を選択する部分と、第3の初期項目を選択する部分とに分割されてもよい。例えば、事前分布決定部18は、第2の事前分布を決定する部分と、第3の事前分布を決定する部分とに分割されてもよい。 The processing device 5 executes the program 7 stored in the storage device 4, and functions as the control unit 15, the first to third ability measurement units 161 to 163, the initial item selection unit 17, and the prior distribution determination unit 18. . Note that the control unit 15, the first to third ability measurement units 161 to 163, and the initial item selection unit 17 may be divided or combined as appropriate. Specifically, for example, the first to third ability measuring units 161 to 163 may be a common ability measuring unit that can measure the first ability to the third ability. For example, the initial item selection unit 17 may be divided into a portion for selecting the second initial item and a portion for selecting the third initial item. For example, the prior distribution determination unit 18 may be divided into a part that determines the second prior distribution and a part that determines the third prior distribution.

処理装置5は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)などのプロセッサとしてもよい。 The processing device 5 may be, for example, a processor such as a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or a DSP (Digital Signal Processor).

制御部15は、例えば、オペレーティング・システムによって実現されてもよい。第1乃至第3の能力測定部161~163、初期項目選択部17、事前分布決定部18は、例えば、オペレーティング・システム上で動作するアプリケーション・プログラムによって実現されてもよい。 The control unit 15 may be implemented by, for example, an operating system. The first to third ability measuring units 161 to 163, the initial item selecting unit 17, and the prior distribution determining unit 18 may be realized by, for example, application programs running on the operating system.

制御部15は、入力装置2から受検者の回答などを入力するための制御を行う。また、制御部15は、記憶装置4に記憶されているプログラム7、各種データを読み出すための制御を行い、記憶装置4へ各種データを記憶させるための制御を行う。さらに、制御部15は、出力装置3によって各種のデータを出力するための制御を行う。以下では、説明を簡略化するため、制御部12による入力装置2、出力装置3、記憶装置4に対する制御を省略して説明する。 The control unit 15 performs control for inputting the examinee's answers and the like from the input device 2 . Further, the control unit 15 performs control for reading the program 7 and various data stored in the storage device 4 and performs control for storing various data in the storage device 4 . Further, the control unit 15 controls the output device 3 to output various data. In the following description, the control of the input device 2, the output device 3, and the storage device 4 by the control unit 12 is omitted in order to simplify the description.

本実施形態において、第1の能力の推定値と第2の能力の推定値との間の相関係数は所定のレベル(閾値)より大きく、第1の能力と第2の能力との間の相関は強いことが予め確認されており、第2の能力の推定値と第3の能力の推定値との相関係数は所定のレベルより大きく、第2の能力と第3の能力との間の相関は強いことが予め確認されているとする。なお、第1の能力の推定値と第2の能力の推定値との間の相関係数はゼロでなければよく、同様に、第2の能力の推定値と第3の能力の推定値との間の相関係数はゼロでなければよい。 In this embodiment, the correlation coefficient between the estimated value of the first ability and the estimated value of the second ability is greater than a predetermined level (threshold), and the correlation between the first ability and the second ability is It is confirmed in advance that the correlation is strong, the correlation coefficient between the estimated value of the second ability and the estimated value of the third ability is greater than a predetermined level, and the correlation between the second ability and the third ability is It is assumed that it is confirmed in advance that the correlation between is strong. Note that the correlation coefficient between the first ability estimate and the second ability estimate need not be zero, and similarly, the second ability estimate and the third ability estimate The correlation coefficient between should be non-zero.

第1の能力測定部161は、第1の適応型テストを実行し、受検者の第1の能力の測定を行う。第1の能力測定部161は、例えば、記憶装置4に記憶されている項目プール8から項目を選択し、選択された項目を出力装置3を用いて受検者へ提示し、項目に対する受検者の回答を入力装置2を用いて受け付け、回答と正誤データとを含む回答データ9を記憶装置4に記憶させる。第1の能力の測定で用いられる第1の初期項目、及び、第1の能力の測定時の能力推定で使用される第1の事前分布は、例えば所定のルールにそって設定されてもよく、実験データから予め設定されていてもよい。第1の能力測定部161は、受検者の第1の能力の最終推定値を含む第1の能力測定データ111を記憶装置4へ記憶させる。 The first ability measuring section 161 executes the first adaptive test and measures the first ability of the examinee. The first ability measurement unit 161 selects an item from, for example, an item pool 8 stored in the storage device 4, presents the selected item to the examinee using the output device 3, and An answer is accepted using the input device 2, and the answer data 9 including the answer and correct/wrong data is stored in the storage device 4. FIG. The first initial item used in the measurement of the first ability and the first prior distribution used in the ability estimation at the time of the measurement of the first ability may be set according to a predetermined rule, for example. , may be preset from experimental data. The first ability measurement unit 161 causes the storage device 4 to store the first ability measurement data 111 including the final estimated value of the examinee's first ability.

初期項目選択部17は、記憶装置4に記憶されている第1の能力測定データ111と第1の回帰モデル121とに基づいて、第2の適応型テストで使用される第2の初期項目を選択し、第2の初期項目を示す初期項目データ13aを記憶装置4に記憶させる。 The initial item selection unit 17 selects a second initial item to be used in the second adaptive test based on the first ability measurement data 111 and the first regression model 121 stored in the storage device 4. The initial item data 13 a indicating the second initial item is stored in the storage device 4 .

事前分布決定部18は、記憶装置4に記憶されている第1の能力測定データ111と第1の回帰モデル121とに基づいて、第2の適応型テストにおける能力推定で使用される第2の事前分布を決定し、決定した第2の事前分布を示す事前分布データ14aを記憶装置4に記憶させる。 Based on the first ability measurement data 111 and the first regression model 121 stored in the storage device 4, the prior distribution determination unit 18 determines the second data used in ability estimation in the second adaptive test. A prior distribution is determined, and prior distribution data 14 a indicating the determined second prior distribution is stored in the storage device 4 .

第2の能力測定部162は、例えば、記憶装置4に記憶されている初期項目データ13a及び事前分布データ14aに基づいて、第2の適応型テストを実行し、受検者の第2の能力の測定を行う。第2の能力測定部162は、例えば、記憶装置4に記憶されている項目プール8から項目を選択し、選択された項目を出力装置3を用いて受検者へ提示し、項目に対する受検者の回答を入力装置2を用いて受け付け、回答と正誤データとを含む回答データ9を記憶装置4に記憶させる。第2の能力測定部162は、受検者の第2の能力の最終推定値を含む第2の能力測定データ112を記憶装置4へ記憶させる。 The second ability measuring unit 162 executes the second adaptive test based on, for example, the initial item data 13a and the prior distribution data 14a stored in the storage device 4, and measures the second ability of the examinee. take measurements. For example, the second ability measurement unit 162 selects an item from the item pool 8 stored in the storage device 4, presents the selected item to the examinee using the output device 3, and An answer is accepted using the input device 2, and the answer data 9 including the answer and correct/wrong data is stored in the storage device 4. FIG. The second ability measurement unit 162 causes the storage device 4 to store the second ability measurement data 112 including the final estimated value of the second ability of the examinee.

初期項目選択部17は、記憶装置4に記憶されている第2の能力測定データ112と第2の回帰モデル122とに基づいて、第3の適応型テストで使用される第3の初期項目を選択し、第3の初期項目を示す初期項目データ13bを記憶装置4に記憶させる。 The initial item selection unit 17 selects a third initial item to be used in the third adaptive test based on the second ability measurement data 112 and the second regression model 122 stored in the storage device 4. The initial item data 13b indicating the third initial item is stored in the storage device 4.

事前分布決定部18は、記憶装置4に記憶されている第2の能力測定データ112と第2の回帰モデル122とに基づいて、第3の適応型テストにおける能力推定で使用される第3の事前分布を決定し、決定した第3の事前分布を示す事前分布データ14bを記憶装置4に記憶させる。 Based on the second ability measurement data 112 and the second regression model 122 stored in the storage device 4, the prior distribution determination unit 18 determines a third ability estimation used in ability estimation in the third adaptive test. A prior distribution is determined, and prior distribution data 14b representing the determined third prior distribution is stored in the storage device 4. FIG.

第3の能力測定部163は、例えば、記憶装置4に記憶されている初期項目データ13b及び事前分布データ14bに基づいて、第3の適応型テストを実行し、受検者の第3の能力の測定を行う。第3の能力測定部163は、例えば、記憶装置4に記憶されている項目プール8から項目を選択し、選択された項目を出力装置3を用いて受検者へ提示し、項目に対する受検者の回答を入力装置2を用いて受け付け、回答と正誤データとを含む回答データ9を記憶装置4に記憶させる。第3の能力測定部163は、受検者の第3の能力の最終推定値を含む第3の能力測定データ113を記憶装置4へ記憶させる。 The third ability measuring unit 163 executes the third adaptive test based on, for example, the initial item data 13b and the prior distribution data 14b stored in the storage device 4, and measures the third ability of the examinee. take measurements. The third ability measurement unit 163 selects an item from, for example, an item pool 8 stored in the storage device 4, presents the selected item to the examinee using the output device 3, and An answer is accepted using the input device 2, and the answer data 9 including the answer and correct/wrong data is stored in the storage device 4. FIG. The third ability measurement unit 163 causes the storage device 4 to store the third ability measurement data 113 including the final estimated value of the examinee's third ability.

以上説明した本実施形態においては、第nの適応型テストで用いられる第nの初期項目及び第nの事前分布が、第n-1の適応型テストの結果に基づいて選択及び決定される。 In the embodiment described above, the nth initial item and the nth prior distribution used in the nth adaptive test are selected and determined based on the result of the n-1th adaptive test.

図2は、本実施形態に係る能力測定装置1による第1の能力の測定から第3の能力の測定までの処理を示すフローチャートである。 FIG. 2 is a flow chart showing the processing from the measurement of the first ability to the measurement of the third ability by the ability measuring device 1 according to this embodiment.

ステップS201において、第1の能力測定部161は、記憶装置4に記憶されている項目プール8から実験などにより予め設定されたルールにしたがって第1の初期項目を選択する。 In step S201, the first ability measuring unit 161 selects a first initial item from the item pool 8 stored in the storage device 4 according to a rule set in advance by experiment or the like.

ステップS202において、第1の能力測定部161は、第1の初期項目を出力装置3から出力させる。これにより、受検者に第1の初期項目が提示される。 In step S202, the first ability measuring unit 161 causes the output device 3 to output the first initial item. This presents the examinee with the first initial item.

ステップS203において、第1の能力測定部161は、入力装置2から第1の初期項目に対する受検者の回答を受け付け、回答及び正誤データを含む回答データ9を記憶装置4に記憶させる。 In step S<b>203 , the first ability measuring unit 161 receives the examinee's answers to the first initial items from the input device 2 , and stores the answer data 9 including the answers and correct/wrong data in the storage device 4 .

ステップS204において、第1の能力測定部161は、記憶装置4に記憶されている回答データ9と実験などにより予め設定された第1の事前分布とに基づいて、受検者の能力推定を行い、算出された推定値を含む推定データ10を記憶装置4に記憶させる。 In step S204, the first ability measuring unit 161 estimates the examinee's ability based on the answer data 9 stored in the storage device 4 and the first prior distribution preset by experiment or the like, Estimated data 10 including the calculated estimated value is stored in the storage device 4 .

ステップS205において、第1の能力測定部161は、記憶装置4に記憶されている推定データ10に基づいて、記憶装置4に記憶されている項目プール8から次の項目を選択する。 In step S<b>205 , the first ability measuring unit 161 selects the next item from the item pool 8 stored in the storage device 4 based on the estimated data 10 stored in the storage device 4 .

ステップS206において、第1の能力測定部161は、選択された次の項目を出力装置3から出力させる。 In step S206, the first ability measuring unit 161 causes the output device 3 to output the next selected item.

ステップS207において、第1の能力測定部161は、入力装置2から項目に対する受検者の回答を受け付け、受け付けた回答及び正誤データが追加されるように記憶装置4の回答データ9を更新する。 In step S207, the first ability measuring unit 161 receives the examinee's answers to the items from the input device 2, and updates the answer data 9 in the storage device 4 so that the accepted answers and correct/wrong data are added.

ステップS208において、第1の能力測定部161は、記憶装置4に記憶されている回答データ9と第1の事前分布とに基づいて、受検者の能力推定を行い、算出された推定値により記憶装置4に記憶されている推定データ10を更新する。 In step S208, the first ability measuring unit 161 estimates the examinee's ability based on the answer data 9 stored in the storage device 4 and the first prior distribution, and stores the calculated estimated value. Update the estimated data 10 stored in the device 4 .

上記のステップS205からステップS208までは、第1の適応型テストの終了条件を満たすまで繰り返し実行される。例えば、第1の適応型テストにおける能力推定によって得られた推定値の精度が所定のレベル以上である場合(標準誤差が所定のレベルより小さい場合)、又は、第1の適応型テストで選択された項目数が所定数を超えた場合に、第1の適応型テストは終了と判断される。 The above steps S205 to S208 are repeatedly executed until the conditions for ending the first adaptive test are satisfied. For example, if the accuracy of the estimate obtained by the ability estimation in the first adaptive test is equal to or greater than a predetermined level (if the standard error is less than a predetermined level), or When the number of items obtained exceeds a predetermined number, it is determined that the first adaptive test is finished.

第1の適応型テストが終了条件を満たす場合、ステップS209において、第1の能力測定部161は、第1の適応型テストにおける能力推定の最終推定値を含む第1の能力測定データ111を記憶装置4に記憶させる。 If the first adaptive test satisfies the end condition, in step S209 the first ability measurement unit 161 stores the first ability measurement data 111 including the final estimated value of ability estimation in the first adaptive test. stored in the device 4;

ステップS210において、初期項目選択部17は、記憶装置4に記憶されている第1の回帰モデル121と第1の能力測定データ111とに基づいて、第2の適応型テストで用いられる第2の初期項目を、記憶装置4に記憶されている項目プール8から選択する。そして、初期項目選択部17は、第2の初期項目を示す初期項目データ13aを記憶装置4に記憶させる。また、事前分布決定部18は、記憶装置4に記憶されている第1の回帰モデル121と第1の能力測定データ111とに基づいて、第2の適応型テストにおける能力推定で使用される第2の事前分布を決定する。そして、事前分布決定部18は、決定した第2の事前分布を示す事前分布データ14aを記憶装置4に記憶させる。 In step S210, the initial item selection unit 17 selects the second item used in the second adaptive test based on the first regression model 121 and the first ability measurement data 111 stored in the storage device 4. An initial item is selected from the item pool 8 stored in the storage device 4 . Then, the initial item selection unit 17 causes the storage device 4 to store the initial item data 13a indicating the second initial item. Also, the prior distribution determination unit 18 determines the second model used in the ability estimation in the second adaptive test based on the first regression model 121 and the first ability measurement data 111 stored in the storage device 4 . 2 priors are determined. Then, the prior distribution determination unit 18 causes the storage device 4 to store the prior distribution data 14a indicating the determined second prior distribution.

ステップS211において、第2の能力測定部162は、記憶装置4に記憶されている初期項目データ13aの示す第2の初期項目を出力装置3から出力させる。これにより、受検者に第2の初期項目が提示される。 In step S<b>211 , the second ability measuring unit 162 causes the output device 3 to output the second initial item indicated by the initial item data 13 a stored in the storage device 4 . This presents the examinee with the second initial item.

ステップS212において、第2の能力測定部162は、入力装置2から第2の初期項目に対する受検者の回答を受け付け、受け付けた回答及び正誤データが追加されるように記憶装置4の回答データ9を更新する。 In step S212, the second ability measurement unit 162 receives the examinee's answers to the second initial items from the input device 2, and stores the answer data 9 in the storage device 4 so that the accepted answers and correct/wrong data are added. Update.

ステップS213において、第2の能力測定部162は、記憶装置4に記憶されている回答データ9と事前分布データ14aの示す第2の事前分布とに基づいて、受検者の能力推定を行い、算出された推定値により記憶装置4に記憶されている推定データ10を更新する。 In step S213, the second ability measuring unit 162 estimates the examinee's ability based on the answer data 9 stored in the storage device 4 and the second prior distribution indicated by the prior distribution data 14a, and calculates The estimated data 10 stored in the storage device 4 is updated with the estimated value obtained.

ステップS214において、第2の能力測定部162は、記憶装置4に記憶されている推定データ10に基づいて、記憶装置4に記憶されている項目プール8から次の項目を選択する。 In step S<b>214 , the second ability measuring unit 162 selects the next item from the item pool 8 stored in the storage device 4 based on the estimated data 10 stored in the storage device 4 .

ステップS215において、第2の能力測定部162は、選択された次の項目を出力装置3から出力させる。 In step S215, the second ability measuring unit 162 causes the output device 3 to output the next selected item.

ステップS216において、第2の能力測定部162は、入力装置2から項目に対する受検者の回答を受け付け、受け付けた回答及び正誤データが追加されるように記憶装置4の回答データ9を更新する。 In step S216, the second ability measuring unit 162 receives the examinee's answers to the items from the input device 2, and updates the answer data 9 in the storage device 4 so that the accepted answers and correct/wrong data are added.

ステップS217において、第2の能力測定部162は、記憶装置4に記憶されている回答データ9と第2の事前分布とに基づいて、受検者の能力推定を行い、算出された推定値により記憶装置4に記憶されている推定データ10を更新する。 In step S217, the second ability measuring unit 162 estimates the examinee's ability based on the answer data 9 stored in the storage device 4 and the second prior distribution, and stores the calculated estimated value. Update the estimated data 10 stored in the device 4 .

上記のステップS214からステップS217までは、第2の適応型テストの終了条件を満たすまで繰り返し実行される。 The above steps S214 to S217 are repeatedly executed until the end condition of the second adaptive test is satisfied.

第2の適応型テストが終了条件を満たす場合、ステップS218において、第2の能力測定部162は、第2の適応型テストにおける能力推定の最終推定値を含む第2の能力測定データ112を記憶装置4に記憶させる。 If the second adaptive test satisfies the termination condition, in step S218 the second ability measurement unit 162 stores the second ability measurement data 112 including the final estimated value of the ability estimation in the second adaptive test. stored in the device 4;

ステップS219において、初期項目選択部17は、記憶装置4に記憶されている第2の回帰モデル122と第2の能力測定データ112とに基づいて、第3の適応型テストで用いられる第3の初期項目を、記憶装置4に記憶されている項目プール8から選択する。そして、初期項目選択部17は、第3の初期項目を示す初期項目データ13bを記憶装置4に記憶させる。また、事前分布決定部18は、記憶装置4に記憶されている第2の回帰モデル122と第2の能力測定データ112とに基づいて、第3の適応型テストにおける能力推定で使用される第3の事前分布を決定する。そして、事前分布決定部18は、決定した第3の事前分布を示す事前分布データ14bを記憶装置4に記憶させる。 In step S219, the initial item selection unit 17 selects the third item used in the third adaptive test based on the second regression model 122 and the second ability measurement data 112 stored in the storage device 4. An initial item is selected from the item pool 8 stored in the storage device 4 . Then, the initial item selection unit 17 causes the storage device 4 to store the initial item data 13b indicating the third initial item. Also, the prior distribution determination unit 18 determines the second regression model 122 and the second ability measurement data 112 stored in the storage device 4, which are used for ability estimation in the third adaptive test. 3 priors are determined. Then, the prior distribution determination unit 18 causes the storage device 4 to store the prior distribution data 14b indicating the determined third prior distribution.

ステップS220において、第3の能力測定部163は、記憶装置4に記憶されている初期項目データ13bの示す第3の初期項目を出力装置3から出力させる。これにより、受検者に第3の初期項目が提示される。 In step S<b>220 , the third ability measuring unit 163 causes the output device 3 to output the third initial item indicated by the initial item data 13 b stored in the storage device 4 . This presents the examinee with the third initial item.

ステップS221において、第3の能力測定部163は、入力装置2から第3の初期項目に対する受検者の回答を受け付け、受け付けた回答及び正誤データが追加されるように記憶装置4の回答データ9を更新する。 In step S221, the third ability measurement unit 163 receives the examinee's answers to the third initial item from the input device 2, and stores the answer data 9 in the storage device 4 so that the accepted answers and correct/wrong data are added. Update.

ステップS222において、第3の能力測定部163は、記憶装置4に記憶されている回答データ9と事前分布データ14bの示す第3の事前分布とに基づいて、受検者の能力推定を行い、算出された推定値により記憶装置4に記憶されている推定データ10を更新する。 In step S222, the third ability measuring unit 163 estimates the examinee's ability based on the answer data 9 stored in the storage device 4 and the third prior distribution indicated by the prior distribution data 14b, and calculates The estimated data 10 stored in the storage device 4 is updated with the estimated value obtained.

ステップS223において、第3の能力測定部163は、記憶装置4に記憶されている推定データ10に基づいて、記憶装置4に記憶されている項目プール8から次の項目を選択する。 In step S<b>223 , the third ability measuring unit 163 selects the next item from the item pool 8 stored in the storage device 4 based on the estimated data 10 stored in the storage device 4 .

ステップS224において、第3の能力測定部163は、選択された次の項目を出力装置3から出力させる。 In step S224, the third ability measuring unit 163 causes the output device 3 to output the next selected item.

ステップS225において、第3の能力測定部163は、入力装置2から項目に対する受検者の回答を受け付け、受け付けた回答及び正誤データが追加されるように記憶装置4の回答データ9を更新する。 In step S225, the third ability measuring unit 163 receives the examinee's answers to the items from the input device 2, and updates the answer data 9 in the storage device 4 so that the accepted answers and correct/wrong data are added.

ステップS226において、第3の能力測定部163は、記憶装置4に記憶されている回答データ9と第3の事前分布とに基づいて、受検者の能力推定を行い、算出された推定値により記憶装置4に記憶されている推定データ10を更新する。 In step S226, the third ability measuring unit 163 estimates the examinee's ability based on the answer data 9 stored in the storage device 4 and the third prior distribution, and stores the calculated estimated value. Update the estimated data 10 stored in the device 4 .

上記のステップS223からステップS226までは、第3の適応型テストの終了条件を満たすまで繰り返し実行される。 The above steps S223 to S226 are repeatedly executed until the conditions for ending the third adaptive test are satisfied.

第3の適応型テストが終了条件を満たす場合、ステップS227において、第3の能力測定部163は、第3の適応型テストにおける能力推定の最終推定値を含む第3の能力測定データ113を記憶装置4に記憶させる。 If the third adaptive test satisfies the termination condition, in step S227, third ability measurement unit 163 stores third ability measurement data 113 including the final estimated value of ability estimation in the third adaptive test. stored in the device 4;

以上説明した本実施形態においては、第n-1の適応型テストの結果に基づいて、第nの適応型テストで用いられる初期項目及び事前分布を選択及び決定する。 In the embodiment described above, the initial items and prior distributions used in the nth adaptive test are selected and determined based on the results of the n-1th adaptive test.

これにより、複数の能力に関する複数の適応型テストの受検者に提示される項目数を減少させることができ、複数の能力を短時間で精度よく測定することができる。 As a result, the number of items presented to examinees of multiple adaptive tests relating to multiple abilities can be reduced, and multiple abilities can be accurately measured in a short period of time.

本実施形態で実行される適応型テストは、1次元適応型テストの応用であり、多次元適応型テストとは異なるため、多次元適応型テストより少ない計算量で複数の能力の測定結果を得ることができる。また、第1の適応型テスト、第2の適応型テスト、第3の適応型テストのいずれを実行しているかを認識することが容易であるため、各能力の測定前に説明、練習などを行うことができる。 The adaptive test performed in this embodiment is an application of the one-dimensional adaptive test, and is different from the multidimensional adaptive test. Therefore, multiple ability measurement results are obtained with a smaller amount of calculation than the multidimensional adaptive test. be able to. In addition, since it is easy to recognize whether the first adaptive test, the second adaptive test, or the third adaptive test is being performed, explanations and exercises should be provided before measuring each ability. It can be carried out.

本実施形態によって得られる効果をより詳しく説明する。 Effects obtained by this embodiment will be described in more detail.

適応型テストの流れは以下の通りである。 The adaptive test flow is as follows.

第1のステップとして、初期項目(問題)が受検者に提示される。初期項目として、例えば、難しい項目、中程度の項目、易しい項目などの3項目程度が提示されてもよい。 As a first step, an initial item (question) is presented to the examinee. As initial items, for example, about three items such as a difficult item, an intermediate item, and an easy item may be presented.

第2のステップとして、これまでに受検者に提示された項目に対する回答の正誤データによって当該受検者の能力推定がベイズ推定によって実行され、推定値が算出される。この推定値の算出に必要な事前分布として、例えば標準正規分布が用いられる。 As a second step, the ability of the examinee is estimated by Bayesian estimation based on the correct/wrong data of the answers to the items presented to the examinee so far, and an estimated value is calculated. A standard normal distribution, for example, is used as a prior distribution necessary for calculating this estimated value.

第3のステップとして、算出された推定値の標準誤差が所定のレベルより小さく、推定値の精度が高いと判断された場合、当該適応型テストが終了される。算出された推定値の標準誤差が所定のレベル以上の場合、現時点の受検者の推定値に対して適切な項目が項目プール8から選択され、受検者に対して提示され、第2のステップに戻る。 As a third step, the adaptive test is terminated if the standard error of the calculated estimate is less than a predetermined level and the estimate is determined to be accurate. If the standard error of the calculated estimated value is equal to or greater than a predetermined level, an item appropriate for the current estimated value of the examinee is selected from the item pool 8 and presented to the examinee, and the second step is performed. return.

本実施形態では、上記のような適応型テストを複数のテストに対して連続的に用いた場合の流れのうち、第1及び第2のステップが統計的に改善されている。 In this embodiment, the first and second steps are statistically improved in the flow when the adaptive test as described above is used continuously for a plurality of tests.

第1のステップに関しては、第1の適応型テストの最終推定値を用いて、第1の適応型テストの後に実行される第2の適応型テストにおける初期推定値を統計的に予測し、予測された初期推定値に対して適切な初期項目を選択するように、改善されている。 For the first step, the final estimate of the first adaptive test is used to statistically predict the initial estimate in a second adaptive test performed after the first adaptive test, predicting It has been refined to select an appropriate initial term for the initial guess made.

第2のステップに関しては、統計的に予測された第2の適応型テストにおける初期推定値と、第1の回帰式における目的変数の予測誤差の標準誤差とを、それぞれ平均と、標準偏差とする事前分布を決定し、第2の適応型テストにおける能力推定に用いるように、改善されている。 For the second step, let the statistically predicted initial estimate in the second adaptive test and the standard error of the prediction error of the objective variable in the first regression equation be the mean and standard deviation, respectively. It is refined to determine the prior distribution and use it for performance estimation in the second adaptive test.

これにより、受検者は、第2の適応型テストを適切な初期項目及び事前分布にそって行うことができる。 This allows the test taker to take the second adaptive test with appropriate initial items and prior distributions.

適応型テストは、能力測定のために必要な時間を短縮することができるメリットがあるが、複数の能力を複数の適応型テストにより順に測定する場合には、トータルの受検時間が長くなる場合がある。受検時間を短くする方法として上記の非特許文献1による方法がある。この非特許文献1の方法は、適応型テストにおける上記第1のステップを改善している。本実施形態は、この非特許文献1の方法よりもさらに受検時間を短縮し、かつ、精度を低下させないことを実現する。 Adaptive tests have the advantage of shortening the time required to measure abilities, but if multiple abilities are measured sequentially by multiple adaptive tests, the total time taken for the tests may become longer. be. As a method for shortening the examination time, there is a method according to Non-Patent Document 1 described above. This non-patent document 1 method improves on the first step in adaptive testing. The present embodiment achieves a shorter test time than the method of Non-Patent Document 1 and does not lower the accuracy.

また、適応型テストの受検時間を短縮化する方法に多次元適応型テストがある。この多次元適応型テストは、次に受検者に提示される項目が複数の能力のうちのどの能力を測定するものか定まらない。このため、多次元適応型テストは、1つの能力測定ごとに例題を設けて実施するような場合に使いにくい。本実施形態は、複数の能力ごとにそれぞれの能力に関する適応型テストが進められていくため、多次元適応型テストと異なり、能力測定に適切な例題を設けることができ、次に受検者に提示される項目がどの能力を測定するための項目であるかを把握容易である。 In addition, there is a multidimensional adaptive test as a method for shortening the time taken for the adaptive test. This multi-dimensional adaptive test does not determine which ability of the plurality of abilities the item presented to the examinee next measures. For this reason, the multidimensional adaptive test is difficult to use in cases where an example is provided for each ability measurement. In this embodiment, adaptive tests are conducted for each ability for each of a plurality of abilities. It is easy to grasp which item is the item for measuring ability.

本実施形態においては、授業時間などの限られた時間内で、適応型テストを実施することができるため、適応型テストとともにアンケート調査を実施することができる。 In this embodiment, since the adaptive test can be conducted within a limited time such as class time, it is possible to conduct a questionnaire survey together with the adaptive test.

表1は、項目反応理論に基づく通常の適応型テスト、非特許文献1の方法、多次元適応型テスト、本実施形態に係る能力測定処理のそれぞれに対するシミュレーション結果の比較例を示す。 Table 1 shows comparative examples of simulation results for the normal adaptive test based on item response theory, the method of Non-Patent Document 1, the multidimensional adaptive test, and the ability measurement process according to the present embodiment.

Figure 0007290272000001
Figure 0007290272000001

この表1は、1000人の仮想的な受検者が、通常の適応型テスト、非特許文献1の方法、多次元適応型テスト、本実施形態に係る能力測定処理の4つの方法で能力測定をした場合の各受検者に対する回答数に関する統計量を表している。 Table 1 shows that 1,000 virtual examinees measured ability by four methods: a normal adaptive test, the method of Non-Patent Document 1, a multidimensional adaptive test, and ability measurement processing according to this embodiment. It represents the statistics on the number of responses for each examinee when

測定される能力の数は3つとし、能力の間の相関係数はすべて0.5としている。 The number of abilities measured is three, and the correlation coefficients between abilities are all 0.5.

また、表1におけるシミュレーションでは、能力値を、分散1の標準正規分布から発生させた。また、項目反応理論には、2パラメータロジスティックモデルを使用した。適応型テストの終了条件は、推定値の標準偏差が0.35以下になったときとした。識別力は0.5から1.5の一様分布から発生させた。困難度は-4から4の一様分布から発生させた。 Also, in the simulations in Table 1, performance scores were generated from a standard normal distribution with a variance of one. A two-parameter logistic model was used for item response theory. The termination condition for the adaptive test was when the standard deviation of the estimated values was 0.35 or less. Discrimination power was generated from a uniform distribution from 0.5 to 1.5. Difficulty was generated from a uniform distribution of -4 to 4.

表1より、平均の回答数は、本実施形態に係る能力測定処理と多次元適応型テストとが少なくて好ましい。なお、回答数は、能力測定に必要とされた項目数に対応する。本実施形態に係る能力測定処理と多次元適応型テストとを比較すると、本実施形態に係る能力測定処理の回答数の最大値、及び、受検者間の回答数の標準偏差(ばらつき)は、多次元適応型テストの回答数の最大値、及び、受検者ごとの回答数の標準偏差よりも小さい。 From Table 1, it is preferable that the average number of responses is small in the ability measurement process according to this embodiment and the multidimensional adaptive test. The number of responses corresponds to the number of items required for ability measurement. Comparing the ability measurement process according to this embodiment with the multidimensional adaptive test, the maximum value of the number of responses in the ability measurement process according to this embodiment and the standard deviation (variation) of the number of responses between examinees are Smaller than the maximum number of responses in a multidimensional adaptive test and the standard deviation of the number of responses per test taker.

表2は、通常の適応型テスト、非特許文献1の方法、多次元適応型テスト、本実施形態に係る能力測定処理のそれぞれの評価結果の比較例を示す。 Table 2 shows comparative examples of the evaluation results of the normal adaptive test, the method of Non-Patent Document 1, the multidimensional adaptive test, and the ability measurement processing according to this embodiment.

Figure 0007290272000002
Figure 0007290272000002

表記の表1及び表2より、本実施形態に係る能力測定処理は、回答数が少なくてよく、回答数の最大値が最小であり、受検者間の回答数の標準偏差が小さい。実際の測定においても本実施形態に係る能力測定処理は有効である。 As shown in Tables 1 and 2, the ability measurement process according to the present embodiment requires a small number of responses, the maximum number of responses is the smallest, and the standard deviation of the number of responses among examinees is small. The ability measurement process according to this embodiment is also effective in actual measurement.

なお、本実施形態においては、互いに相関の強い能力を測定する第n-1の適応型テストと第nの適応型テストとが連続して実行される場合を例として説明している。しかしながら、第n-1の適応型テストと第nの適応型テストとの間で、他の能力に関する適応型テストが実行されてもよい。 In this embodiment, an example is described in which the n-1th adaptive test and the nth adaptive test for measuring abilities that are highly correlated with each other are successively executed. However, between the n-1th adaptive test and the nth adaptive test, adaptive tests for other capabilities may be performed.

(第2の実施形態)
上記の第1の実施形態においては、第n-1の適応型テストの最終推定値に基づいて、第nの適応型テストで用いられる初期項目及び事前分布を選択及び決定する。
(Second embodiment)
In the first embodiment above, the initial terms and priors used in the nth adaptive test are selected and determined based on the final estimates of the n-1th adaptive test.

これに対して、本実施形態では、m番目(mは3以上の整数)に実行される第mの適応型テストと相関の強いm-2番目に実行された第m-2の適応型テスト及びm-1番目に実行された第m-1の適応型テストが、第mの適応型テストよりも前に行われている場合に、第m-2の適応型テストの結果(第m-2の能力の推定値)及び第m-1の適応型テストの結果(第m-1の能力の推定値)に基づいて、第mの適応型テストで用いられる初期項目及び事前分布を選択及び決定する。 On the other hand, in the present embodiment, the m-2th adaptive test that has a strong correlation with the m-th (m is an integer equal to or greater than 3) executed m-th adaptive test And if the m-1th adaptive test executed m-1th is performed before the m-th adaptive test, the result of the m-2th adaptive test (m-th 2 ability estimate) and the results of the m-1th adaptive test (m-1th ability estimate), select and decide.

図3は、本実施形態に係る能力測定処理の一例を示すフローチャートである。 FIG. 3 is a flowchart showing an example of ability measurement processing according to this embodiment.

本実施形態において、第3の能力は、第1及び第2の能力と所定レベルよりも強い相関を持つとする。しかしながら、本実施形態に係る能力測定装置は、第1の能力の推定値と第3の能力の推定値との間の相関係数がゼロではなく、さらに、第2の能力の推定値と第3の能力の推定値との間の相関係数がゼロでなければ、有効な測定を実施可能である。 In this embodiment, it is assumed that the third ability has a stronger correlation than the predetermined level with the first and second abilities. However, in the ability measuring device according to the present embodiment, the correlation coefficient between the first estimated ability value and the third ability estimated value is not zero, and furthermore, the second ability estimated value and the second ability estimated value A valid measurement can be made if the correlation coefficient between the 3 capacity estimates is non-zero.

この図3では、ステップS300が上記図2のステップS219と相違しているが、図3の他のステップは図2の他のステップと同じである。 In FIG. 3, step S300 is different from step S219 in FIG. 2, but other steps in FIG. 3 are the same as those in FIG.

ステップS300において、初期項目選択部17は、記憶装置4に記憶されている第2の回帰モデル122と第1の能力測定データ111と第2の能力測定データ112とに基づいて、第3の適応型テストで用いられる第3の初期項目を、記憶装置4に記憶されている項目プール8から選択する。そして、初期項目選択部17は、第3の初期項目を示す初期項目データ13bを記憶装置4に記憶させる。 In step S300, the initial item selection unit 17 selects the third adaptive A third initial item to be used in the type test is selected from the item pool 8 stored in the storage device 4 . Then, the initial item selection unit 17 causes the storage device 4 to store the initial item data 13b indicating the third initial item.

また、事前分布決定部18は、記憶装置4に記憶されている第2の回帰モデル122と第1の能力測定データ111と第2の能力測定データ112とに基づいて、第3の適応型テストにおける能力推定で使用される第3の事前分布を決定する。そして、事前分布決定部18は、決定した第3の事前分布を示す事前分布データ14bを記憶装置4に記憶させる。 Further, the prior distribution determination unit 18 performs a third adaptive test based on the second regression model 122, the first ability measurement data 111, and the second ability measurement data 112 stored in the storage device 4. Determine a third prior distribution to be used in the ability estimation in . Then, the prior distribution determination unit 18 causes the storage device 4 to store the prior distribution data 14b indicating the determined third prior distribution.

本実施形態において、第2の回帰モデル122は、第1の能力測定データ111と第2の能力測定データ112に基づいて第3の初期項目を選択するための重回帰式を含む。重回帰式は、第1の能力の能力値を第1の説明変数とし、第2の能力の能力値を第2の説明変数とし、第3の能力の能力値を目的変数とする。重回帰式に、第1の能力の最終推定値及び第2の能力の最終推定値を代入することにより、第3の能力の初期推定値が算出され、第3の能力の初期推定値に対応する第3の初期項目が選択される。 In this embodiment, the second regression model 122 includes multiple regression equations for selecting the third initial item based on the first performance measurement data 111 and the second performance measurement data 112. FIG. The multiple regression formula uses the ability value of the first ability as the first explanatory variable, the ability value of the second ability as the second explanatory variable, and the ability value of the third ability as the objective variable. By substituting the final estimated value of the first ability and the final estimated value of the second ability into the multiple regression equation, an initial estimated value of the third ability is calculated, corresponding to the initial estimated value of the third ability A third initial item is selected.

また、本実施形態において、第2の回帰モデル122は、例えば、第3の能力の初期推定値を事前分布における平均とし、重回帰式における目的変数の予測区間を求める際の標準誤差を標準偏差とする。 Further, in the present embodiment, the second regression model 122, for example, assumes that the initial estimated value of the third ability is the average in the prior distribution, and the standard error when obtaining the prediction interval of the objective variable in the multiple regression equation is the standard deviation and

以上説明したように、複数の適応型テストが実行される場合に、先に測定された複数の能力の結果を用いて、次に実行される適応型テストの初期項目及び事前分布を選択及び決定することにより、効率よくかつ精度よく受検者の複数の能力を測定することができる。 As described above, when multiple adaptive tests are performed, the results of the previously measured multiple abilities are used to select and determine the initial items and prior distribution of the adaptive test to be performed next. By doing so, it is possible to efficiently and accurately measure a plurality of abilities of the examinee.

なお、本実施形態においては、互いに相関の強い能力を測定する第m-2の適応型テストと第m-1の適応型テストと第mの適応型テストとが連続して実行される場合を例として説明している。しかしながら、第m-2の適応型テストと第m-1の適応型テストとの間で、他の能力の適応型テストが実行されてもよく、第m-1の適応型テストと第mの適応型テストとの間で、他の能力の適応型テストが実行されてもよい。 In the present embodiment, the case where the m-2th adaptive test, the m-1th adaptive test, and the m-th adaptive test for measuring abilities with a strong correlation are successively executed is assumed. It is described as an example. However, between the m-2th adaptive test and the m-1th adaptive test, adaptive tests of other capabilities may be performed, such that the m-1th adaptive test and the m-th adaptive test In between adaptive tests, adaptive tests of other capabilities may be performed.

また、第mの適応型テストの初期項目及び事前分布は、2つの適応型テストの結果から選択及び決定されているが、3以上の適応型テストの結果から選択及び決定されてもよい。 Also, the initial items and prior distribution of the m-th adaptive test are selected and determined from the results of two adaptive tests, but may be selected and determined from the results of three or more adaptive tests.

(第3の実施形態)
本実施形態では、上記第1及び第2の実施形態で説明した能力測定装置1によって実行される能力測定処理をさらに詳細に説明する。
(Third embodiment)
In this embodiment, the ability measurement processing executed by the ability measuring device 1 described in the first and second embodiments will be described in further detail.

<項目反応理論モデル>
第1及び第2の実施形態に係る能力測定処理は、項目反応理論を用いる。項目反応理論は、項目の難易度と受検者の能力の分離を、項目特性関数を用いることで可能とする。
<Item response theory model>
The ability measurement process according to the first and second embodiments uses item response theory. Item response theory makes it possible to separate item difficulty and examinee ability by using item characteristic functions.

項目特性関数は、能力θの受検者がある項目に対して正答する確率を示すθの関数である。横軸を受検者の能力θとし、縦軸を項目の正答確率とし、項目特性関数を表現した曲線を、項目特性曲線という。項目特性曲線を表現する項目反応理論モデルの一例として、ロジスティックモデルが用いられる。以下では、2パラメータロジスティックモデル(parameter logistic model:PLM)を例として説明する。 The item characteristic function is a function of θ that indicates the probability that an examinee with ability θ will answer a certain item correctly. A curve expressing the item characteristic function, with the ability θ of the examinee on the horizontal axis and the probability of correct answer of the item on the vertical axis, is called the item characteristic curve. A logistic model is used as an example of an item response theory model that expresses an item characteristic curve. A two-parameter logistic model (PLM) will be described below as an example.

2PLMでは、識別力パラメータaと困難度パラメータbの2つのパラメータが用いられる。項目jの正答確率を、識別力パラメータaj、困難度パラメータbjを用いて能力θの関数として表すと、(1)式が得られる。 2PLM uses two parameters, a discrimination power parameter a and a difficulty parameter b. Expression (1) is obtained by expressing the correct answer probability of item j as a function of ability θ using discriminating power parameter a j and difficulty parameter b j .

Figure 0007290272000003
Figure 0007290272000003

なお、(1)式において、θの定義域は実数全体となっているが、θが標準正規分布に従うとき、ほとんどの受検者の能力はおよそ-4から4の間の値となる。 In equation (1), the domain of θ is all real numbers.

図4は、項目特性曲線の例を示すグラフである。図4において、実線のグラフはa=1.0、b=-1.0のとき、破線のグラフはa=0.5、b=-1.0のとき、点線のグラフはa=1.0、b=1.5のときの項目特性曲線をそれぞれ表している。識別力パラメータaは正答確率が0.5となるときの曲線の傾きを表し、困難度パラメータbは正答確率が0.5となるときの能力θの値を表す。一般に、項目特性曲線はaの値が大きいほど曲線の傾きは急になり、識別力が高まる。しかし、どのような能力の受検者に対しても識別力が高い項目はなく、グラフの傾きが急なところ、すなわち能力がb付近の受検者の能力を測定することが適している。 FIG. 4 is a graph showing an example of item characteristic curves. In FIG. 4, the solid line indicates a=1.0 and b=-1.0, the dashed line indicates a=0.5 and b=-1.0, and the dotted line indicates a=1.0. Item characteristic curves for 0 and b=1.5 are shown, respectively. The discriminating power parameter a represents the slope of the curve when the correct answer probability is 0.5, and the difficulty parameter b represents the value of ability θ when the correct answer probability is 0.5. In general, the larger the value of a, the steeper the slope of the item characteristic curve, and the higher the distinguishing power. However, there is no item with high discriminative power for examinees of any ability, and it is suitable to measure the ability of examinees whose ability is near b, where the slope of the graph is steep.

例えば、実線のグラフと破線のグラフは、ともに能力θが-1付近の受検者を測定するのに適した項目であることを示すが、実線のグラフの方が破線のグラフよりも傾きが急であることから識別力が高い。また、実線のグラフと点線のグラフは最も急な部分の傾きは等しいため、識別力は同等だが、測定に適した能力θが異なっており、点線のグラフの方がより高い能力を識別するのに適している。 For example, both the solid line graph and the dashed line graph show that the item is suitable for measuring examinees whose ability θ is around -1, but the solid line graph has a steeper slope than the dashed line graph. Therefore, it has high discriminative power. In addition, since the slope of the steepest part of the solid line graph and the dotted line graph are the same, the discriminative power is the same, but the ability θ suitable for measurement is different, and the dotted line graph has a higher ability to discriminate. Suitable for

<項目プール>
同じテストを複数の集団に実施したとき、能力の高い集団にとっては簡単であり、能力の低い集団にとっては難しいと評価される。このように、テストの難易度の評価が、そのテストの受検者集団の能力に依存することを標本依存性という。また、個々の受検者のテスト得点は、項目が全体的に簡単であれば高くなり、項目が全体的に難しければ低くなる。このように、受検者の能力の評価が項目の難易度に依存することを項目依存性という。項目反応理論を用いることによって、標本依存性及び項目依存性を低減させて、受検者の能力を評価することが可能になる。標本依存性及び項目依存性を低減させるための条件の1つとして、テストを構成する各項目について、識別力パラメータ及び困難度パラメータの値がすでに明らかになっていること、あるいは事後的に明らかになることが必要である。パラメータの推定値がすでに得られている項目の集合を項目プール8という。項目に関するパラメータの推定値を求めるためには、そのテストが想定する受検者母集団を代表するような一定数の受検者がその項目にどう回答したかという情報が事前に必要である。項目は何度も繰り返して使用可能であり、実施したテストの内容は公開されず、秘匿されることが好ましい。本実施形態では、第1の適応型テストの実行前に、すでに項目に関するパラメータの推定値が得られており、項目プール8が生成されているとする。
<item pool>
When the same test is administered to multiple groups, it is rated as easy for high-skilled groups and difficult for low-skilled groups. In this way, the evaluation of the difficulty of a test depends on the ability of the examinee group to take the test, which is called sample dependence. In addition, individual examinees' test scores will be higher if the item is overall easier and lower if the item is overall more difficult. In this way, the fact that the evaluation of examinee's ability depends on the degree of difficulty of the item is called item dependency. By using the item response theory, it is possible to reduce specimen dependence and item dependence to evaluate examinee ability. One of the conditions for reducing sample dependence and item dependence is that the values of the discrimination power parameter and the difficulty parameter are already clarified for each item that constitutes the test, or that they are clarified after the fact It is necessary to become A set of items for which parameter estimates have already been obtained is called an item pool 8 . Estimates of parameters for an item require prior knowledge of how a certain number of test-takers, representative of the test-taker population for which the test is intended, responded to the item. The item can be used over and over again, and preferably the content of the test performed is not disclosed and kept confidential. In this embodiment, it is assumed that parameter estimates for items have already been obtained and an item pool 8 has been generated prior to execution of the first adaptive test.

<能力パラメータの推定>
能力パラメータの推定方法としては、最尤推定法、MAP推定法、EAP推定法などがある。MAP推定法及びEAP推定法は、ベイズ法を用いる推定法である。
<Estimation of ability parameters>
Methods of estimating ability parameters include maximum likelihood estimation, MAP estimation, and EAP estimation. The MAP estimation method and the EAP estimation method are estimation methods using the Bayesian method.

最尤推定法は、能力θをある値に固定したときにその反応パターンが得られる確率(尤度)を最大にするようなθの値を求める方法である。能力θの受検者がJ個の項目に回答し、その項目に対する反応パターンu=(u1,u2,…,uJ)が得られた場合、項目jに対する正答確率pj(θ)、誤答確率qj(θ)=1-pj(θ)とした場合、尤度関数は、(2)式で表される。 The maximum likelihood estimation method is a method of obtaining a value of θ that maximizes the probability (likelihood) of obtaining that reaction pattern when ability θ is fixed at a certain value. When an examinee with ability θ answers J items and obtains a reaction pattern u=(u 1 , u 2 , . When the probability of incorrect answer q j (θ)=1−p j (θ), the likelihood function is expressed by equation (2).

Figure 0007290272000004
Figure 0007290272000004

この(2)式に対して、両辺の自然対数Inをとり、接線の傾きがゼロとなるようなθを求めるためにθで微分し、当該式がゼロとなる方程式を解くことにより、θの最尤推定値が得られる。(3)式から得られるθが最尤推定値となる。 Taking the natural logarithm In of both sides of this equation (2), differentiating with respect to θ to obtain θ such that the slope of the tangent becomes zero, and solving the equation that makes the equation zero, we obtain θ A maximum likelihood estimate is obtained. θ obtained from the equation (3) is the maximum likelihood estimation value.

Figure 0007290272000005
Figure 0007290272000005

この(3)式を尤度方程式という。なお、2PLMにおいては、pj(θ)とqj(θ)のθによる微分結果は(4)式となる。 This equation (3) is called a likelihood equation. In 2PLM, the result of differentiation of p j (θ) and q j (θ) with respect to θ is given by Equation (4).

Figure 0007290272000006
Figure 0007290272000006

最尤推定法を用いるための数値計算の方法として、逐次近似法が用いられる。最尤推定法で全問正解又は全問不正解の場合には、最尤推定値はそれぞれ無限大又はマイナス無限大となり、解を求めることができない。このような場合の対処法として、以下に示すベイズ推定を利用可能である。 A successive approximation method is used as a numerical calculation method for using the maximum likelihood estimation method. If all questions are answered correctly or incorrectly by the maximum likelihood estimation method, the maximum likelihood estimation value becomes infinity or minus infinity, respectively, and a solution cannot be obtained. As a countermeasure for such cases, the Bayesian estimation described below can be used.

MAP推定法は、事後分布の確率密度が最大となるθを推定値とする方法である。事後分布はθに関する確率分布であり、MAP推定法では事後分布を見て最も確率が高いθの値を求める。 The MAP estimation method is a method in which θ that maximizes the probability density of the posterior distribution is used as an estimated value. The posterior distribution is a probability distribution regarding θ, and the MAP estimation method obtains the value of θ with the highest probability by looking at the posterior distribution.

ベイズの定理により、事後分布g(θ|u)は、尤度関数L(θ|u)と事前分布f(θ)から(5)式により得られる。 According to Bayes' theorem, the posterior distribution g(θ|u) is obtained from the likelihood function L(θ|u) and the prior distribution f(θ) according to Equation (5).

Figure 0007290272000007
Figure 0007290272000007

(5)式の分母はθを含まない定数として扱うことができるため、g(θ|u)はL(θ|u)f(θ)に比例すると考えられる。ここで、θの事前分布f(θ)を、平均μ、分散σ2の正規分布N(μ,σ2)とすると、(6)が得られる。 Since the denominator of equation (5) can be treated as a constant that does not include θ, g(θ|u) is considered to be proportional to L(θ|u)f(θ). Here, if the prior distribution f(θ) of θ is assumed to be a normal distribution N(μ, σ 2 ) with mean μ and variance σ 2 , (6) is obtained.

Figure 0007290272000008
Figure 0007290272000008

(6)式の両辺の自然対数をとり、θで微分してゼロとすると、(7)式が得られる。 Taking the natural logarithm of both sides of the equation (6) and differentiating with respect to θ to zero, the equation (7) is obtained.

Figure 0007290272000009
Figure 0007290272000009

(7)式を解くことにより、MAP推定値が得られる。なお、(7)式を解く場合には、最尤推定法の場合と同様に逐次近似法が用いられる。 Solving equation (7) yields the MAP estimate. When solving the equation (7), the iterative approximation method is used as in the case of the maximum likelihood estimation method.

EAP推定法は、θの事後分布の期待値をθの推定値とする推定方法である。EAP推定量はθの事後分布である(5)式の期待値として、(8)式で表される。 The EAP estimation method is an estimation method in which the expected value of the posterior distribution of θ is the estimated value of θ. The EAP estimator is expressed by Equation (8) as the expected value of Equation (5), which is the posterior distribution of θ.

Figure 0007290272000010
Figure 0007290272000010

MAP推定法もEAP推定法も同じ事後分布に基づいてθを推定するが、MAP推定法は事後分布における最頻値を求め、EAP推定法は事後分布における平均値を求める点で相違する。 Both the MAP estimation method and the EAP estimation method estimate θ based on the same posterior distribution.

<第1の適応型テストにおける初期項目の選択と能力推定>
第1の適応型テストでは、項目プール8の中から初期項目が選択され、受検者へ提示される。初期項目として選択される項目数は、1つでもよく、複数でもよい。受検者の能力の分布を標準正規分布とすると、θ=0付近の受検者の能力をよく測定できるような項目が選択されるべきである。初期項目として1つの項目を選択するのであれば、項目困難度パラメータがゼロに最も近い項目を選択する。本実施形態における第1の適応型テストでは、それぞれ項目困難度パラメ-タが-1、0、1に最も近い3つの項目が、初期項目として選択されるものとする。選択された初期項目に対する回答から能力値θの最初の推定値θhが算出される。θの推定には、適当な分布を事前分布としたベイズ推定が用いられるが、最尤推定法が用いられてもよい。
なお、上記の初期項目の選択方法は例であり、適宜変更可能である。例えば、それぞれ項目困難度パラメータが-0.5、0、0.5に最も近い項目が初期項目として選択されてもよい。例えば、それぞれ項目困難度パラメータが-0.5、0.5に最も近い2つの項目が初期項目として選択されてもよい。このように初期項目の選択において用いられる項目困難度パラメータの値は変更可能であり、初期項目として選択される項目数も変更可能である。
<Selection of initial items and ability estimation in the first adaptive test>
In the first adaptive test, initial items are selected from the item pool 8 and presented to the test taker. The number of items selected as initial items may be one or plural. Assuming that the distribution of examinee's abilities is a standard normal distribution, an item should be selected so that the examinee's ability can be well measured near θ=0. If one item is selected as the initial item, select the item whose item difficulty parameter is closest to zero. In the first adaptive test in this embodiment, three items whose item difficulty parameters are closest to -1, 0, and 1 are selected as initial items. An initial estimate θh of the ability value θ is calculated from the answers to the selected initial items. For estimating θ, Bayesian estimation using an appropriate distribution as a prior distribution is used, but maximum likelihood estimation may be used.
Note that the method of selecting the initial items described above is an example, and can be changed as appropriate. For example, the items whose item difficulty parameters are closest to -0.5, 0, and 0.5, respectively, may be selected as initial items. For example, the two items whose item difficulty parameters are closest to −0.5 and 0.5, respectively, may be selected as initial items. Thus, the value of the item difficulty parameter used in selecting the initial items can be changed, and the number of items selected as the initial items can also be changed.

<項目選択基準>
最初の能力値が推定された後、次の項目の選択、能力推定が繰り返される。次の項目はフィッシャー情報量基準(MFI)、オーエンの近似ベイズ基準(Owen)、尤度重み付き情報量基準(MLWI)、又は、事後重み付き情報量基準(MPWI)といった項目選択基準に基づいて選択される。
<Item selection criteria>
After the first ability value is estimated, selection of the next item and ability estimation are repeated. The following items are based on item selection criteria: Fisher's Information Criterion (MFI), Owen's Approximate Bayesian Criterion (Owen), Likelihood Weighted Information Criterion (MLWI), or Posterior Weighted Information Criterion (MPWI). selected.

フィッシャー情報量とは、最尤推定量からθが離れるに従って対数尤度が小さくなる度合いを表す情報量である。フィッシャー情報量が急激に小さくなればなるほど最尤推定量の推定がよいことを表す。このため、MFIは、最尤推定量の減少状態を用いて各項目の情報量を比較するために使用される。Owenでは、θの事後分布の期待値と項目プール8内の困難度との差の絶対値が一定値以下になる項目が選択される。また、θの推定値θhは、特に適応型テストの初期においてθとの差が大きい場合がある。θhに大きく影響されるMFI及びOwenでは、適切な項目を選択できない可能性があるが、MLWIは各θにおけるフィッシャー情報量に対して尤度で重み付けした値を用いることにより、適切な項目を選択可能とする。さらに、MPWIでは、MLWIに対して適切な事前分布が設定されている場合に、より適切な項目の選択が可能になるため、事後分布が重み付けに用いられる。 The Fisher information amount is an amount of information representing the degree to which the logarithmic likelihood decreases as θ separates from the maximum likelihood estimator. The steeper the Fisher information amount, the better the estimation of the maximum likelihood estimator. For this reason, MFI is used to compare the information content of each item using the reduced state of the maximum likelihood estimator. Owen selects items for which the absolute value of the difference between the expected value of the posterior distribution of θ and the degree of difficulty in the item pool 8 is equal to or less than a certain value. Also, the estimated value θh of θ may have a large difference from θ especially at the beginning of the adaptive test. MFI and Owen, which are greatly affected by θh, may not be able to select appropriate items. make it possible. Furthermore, in MPWI, the posterior distribution is used for weighting, since more appropriate item selection is possible when an appropriate prior distribution is set for MLWI.

MFIは、後述の(10)式で与えられるI(θhj)を最大にする項目jを選択する方法である。フィッシャー情報I(θ)は、反応パターンに対するθの対数尤度をθで2階微分した値の負の期待値であるが、2PLMにおいては、(9)式で表される。 MFI is a method of selecting an item j that maximizes I(θh j ) given by equation (10) below. The Fisher information I(θ) is the negative expected value of the value obtained by second-order differentiating the logarithmic likelihood of θ with respect to the reaction pattern with θ.

Figure 0007290272000011
Figure 0007290272000011

この(9)式は、(10)式の項目情報量の合計であり、MFIは、項目情報量の値に着目した方法である。ただし、qj(θ)=1-pj(θ)である。 This formula (9) is the total amount of item information in formula (10), and MFI is a method that focuses on the value of the item information amount. However, q j (θ)=1−p j (θ).

Figure 0007290272000012
Figure 0007290272000012

選択される項目の順番をkを用いて表す。MLWIは、(11)式で示すような、各θの尤度L(θ|uj1,…,ujk-1)によって項目jの各θにおけるフィッシャー情報量に重み付けをした値の積分値が、最大となる項目を選択する方法である。 The order of items to be selected is represented using k. MLWI is the integral value of the value obtained by weighting the Fisher information amount at each θ of item j by the likelihood L (θ|u j1 , . , is the method of selecting the maximum item.

Figure 0007290272000013
Figure 0007290272000013

MPWIは、ベイズ型のMLWIであり、θの事前分布をg(θ)として(12)式が最大となる項目を選択する方法である。 MPWI is a Bayesian MLWI, and is a method of selecting an item that maximizes the expression (12) with the prior distribution of θ as g(θ).

Figure 0007290272000014
Figure 0007290272000014

適応型テストの初期においてθhとθとの差は大きい可能性がある。そのような状況においても、MFIではフィッシャー情報量が大きい項目に大きく依存した項目を選択し、Owenの方法ではθhに最も困難度パラメータが近い項目を選択する。しかし、MLWI及びMPWIは、フィッシャー情報量に対して尤度や事前分布で重み付けした値を用いるという点でMFI及びOwenと異なる。 At the beginning of adaptive testing, the difference between θh and θ can be large. Even in such a situation, the MFI selects items that are highly dependent on items with a large amount of Fisher's information, and the Owen's method selects the item whose difficulty parameter is closest to θh. However, MLWI and MPWI differ from MFI and Owen in that they use a value weighted by the likelihood or prior distribution for the Fisher information amount.

MLWIとMPWIとは、(11)式及び(12)式に示すように、フィッシャー情報量に対する重みとして尤度を用いるか、あるいは事後分布を用いるか、という点で相違する。 As shown in equations (11) and (12), MLWI and MPWI differ in that the likelihood or the posterior distribution is used as the weight for the Fisher information amount.

MLWIでは、適応型テストの初期において、選択される項目が識別力パラメータに大きく依存する可能性がある。この原因は、適応型テストの初期においては尤度がフラットでθの推定値がほとんど定まっておらず、Ijk(θ)がaj 2に比例して大きくなるためである。よって、結果的に他の条件があまり反映されず、識別力パラメータが大きい項目が選択されやすくなる。 In MLWI, at the beginning of the adaptive test, the items selected can be highly dependent on the discriminant power parameters. The reason for this is that the likelihood is flat at the beginning of the adaptive test, the estimated value of θ is almost indeterminate, and I jk (θ) increases in proportion to a j 2 . Therefore, as a result, other conditions are not reflected so much, and items with large discrimination power parameters are likely to be selected.

また、MPWIでは、事前分布を用いるため、適応型テストの初期においても事前分布の影響が反映され、MLWIと比較して適応型テストの初期においてもある程度は適当なθの推定がなされる。ただし、事前分布が適切に設定されている場合には問題ないが、事前分布が適切でない場合にはθhの標準誤差が小さくなりづらく、選択する項目数が増えてしまう可能性がある。 In addition, since MPWI uses a prior distribution, the influence of the prior distribution is reflected even in the early stage of the adaptive test, and θ can be estimated appropriately to some extent even in the early stage of the adaptive test compared to MLWI. However, there is no problem if the prior distribution is set appropriately, but if the prior distribution is not appropriate, it is difficult to reduce the standard error of θh, and the number of items to be selected may increase.

<能力推定の終了条件>
上述の項目選択基準を用いることにより、初期項目以降の項目が選択される。そして、ある項目が選択され、受検者に提示され、その回答が得られるたびに、それまでに選択した項目すべての回答から能力の推定値θhが更新される。
<Completion condition of ability estimation>
Items after the initial item are selected by using the item selection criteria described above. Each time an item is selected and presented to the examinee and an answer is obtained, the estimated ability θh is updated from the answers of all the items selected so far.

終了条件が満たされるまで、項目の選択から能力推定までの処理が繰り返され、終了条件が満たされると、選択されたすべての項目に対する回答から最終推定値θhが得られる。なお、終了条件としては、θhの推定値の標準誤差の値が閾値以下になることが用いられてもよく、選択項目数が閾値に達することが用いられてもよく、又は、これらが複合的に用いられてもよい。
本実施形態においては、複数の能力ごとに終了条件が判断される。
The process from item selection to ability estimation is repeated until the end condition is satisfied, and when the end condition is satisfied, the final estimated value θh is obtained from the answers to all the selected items. The termination condition may be that the standard error of the estimated value of θh is equal to or less than a threshold, or that the number of selected items reaches a threshold, or a combination of these may be used for
In this embodiment, a termination condition is determined for each of a plurality of abilities.

<能力の推定方法>
本実施形態において、第1の適応型テストでは、通常の適応型テストと同様の処理が実行される。その後、第1の適応型テストより後に実行される第2の適応型テストでは、第2の適応型テストより前に測定された少なくとも1つの最終推定値に基づいて第2の適応型テストの初期推定値が算出され、算出された初期推定値を用いて第2の適応型テストの初期項目が選択される。また、初期推定値とその標準偏差とに基づいて事前分布が決定され、第2の適応型テストにおいて、決定された事前分布を利用してベイズ法によって能力の推定値が算出される。
<How to estimate ability>
In this embodiment, in the first adaptive test, processing similar to that of a normal adaptive test is executed. Then, in a second adaptive test performed after the first adaptive test, an initial An estimate is calculated and the initial item for the second adaptive test is selected using the calculated initial estimate. Also, a prior distribution is determined based on the initial estimates and their standard deviations, and in a second adaptive test, the determined prior distributions are used to calculate an estimate of ability by a Bayesian method.

<第1の実施形態に係る初期項目の選択>
第1の実施形態においては、過去の受検者の第1の能力の能力値を説明変数、過去の受検者の第2の能力の能力値を目的変数とする単回帰式が用いられる。ここで、過去の受検者とは、複数の能力を測定済みの者である。この単回帰式に現在の受検者の第1の能力の最終推定値を説明変数として代入することにより、第2の能力の初期推定値θ0が算出される。第2の適応型テストでは、この第2の能力の初期推定値θ0に対応する初期項目が用いられる。
<Selection of initial items according to the first embodiment>
In the first embodiment, a simple regression equation is used in which the ability value of the past examinee's first ability is an explanatory variable and the ability value of the past examinee's second ability is an objective variable. Here, a past examinee is a person whose multiple abilities have been measured. By substituting the final estimated value of the first ability of the current examinee into this simple regression equation as an explanatory variable, the initial estimated value θ 0 of the second ability is calculated. The second adaptive test uses the initial term corresponding to this second initial estimate of ability θ 0 .

第1の実施形態において、第3の能力を測定する場合、過去の受検者の第2の能力の能力値を説明変数、過去の受検者の第3の能力の能力値を目的変数とする単回帰式が用いられる。この単回帰式に現在の受検者の第2の能力の最終推定値を説明変数として代入することにより、第3の能力の初期推定値θ0が算出される。第3の適応型テストでは、この第3の能力の初期推定値θ0に対応する初期項目が用いられる。 In the first embodiment, when measuring the third ability, the ability value of the past examinee's second ability is an explanatory variable, and the ability value of the past examinee's third ability is an objective variable. A regression equation is used. The initial estimated value θ 0 of the third ability is calculated by substituting the final estimated value of the second ability of the current examinee into this simple regression equation as an explanatory variable. The third adaptive test uses the initial item corresponding to the initial estimate θ 0 of this third ability.

第4以降の能力を測定する場合も同様である。具体的には、過去の受検者の第n-1の能力の能力値を説明変数、過去の受検者の第nの能力の能力値を目的変数とする単回帰式が用いられる。この単回帰式に受検者の第n-1の能力の最終推定値を説明変数として代入することにより、第nの能力の初期推定値θ0が算出される。第nの適応型テストでは、この第nの能力の初期推定値θ0に対応する初期項目が用いられる。 The same is true when measuring the fourth and subsequent abilities. Specifically, a simple regression formula is used in which the ability value of the past examinee's n-1th ability is an explanatory variable and the ability value of the past examinee's nth ability is an objective variable. The initial estimated value θ 0 of the n-th ability is calculated by substituting the final estimated value of the examinee's n-1th ability into this simple regression equation as an explanatory variable. The nth adaptive test uses the initial item corresponding to this nth initial estimate of ability θ 0 .

上記の各単回帰式は、過去の受検者の実測データから予め設定されている。 Each of the above simple regression equations is set in advance from actual measurement data of past examinees.

以下で、初期推定値θ0に基づいて、初期項目を選択する4つの例を説明する。なお、以下で説明する4つの例は適宜変更可能である。
第1の例では、困難度パラメータが-1、0、1に最も近い3項目を選択する。
第2の例では、困難度パラメータがθh0-0.5、0、θh0+0.5に最も近い3項目を選択する。
第3の例では、困難度パラメータがθh0に最も近い1項目のみを選択する。
第4の例では、θh0に対してフィッシャー情報量が最大となる1項目のみを選択する。
Below we describe four examples of selecting initial terms based on the initial estimate θ 0 . Note that the four examples described below can be changed as appropriate.
In the first example, the three items whose difficulty parameters are closest to -1, 0, and 1 are selected.
In the second example, the three items whose difficulty parameters are closest to θh 0 −0.5, 0, and θh 0 +0.5 are selected.
In the third example, only the one item whose difficulty parameter is closest to θh 0 is selected.
In the fourth example, only one item with the maximum Fisher information amount for θh 0 is selected.

上記の第1乃至第4の例のうち、第1の例は、θh0を用いていない。この第1の例は、例えば第1の適応型テストの初期項目の選択、又は、複数の能力の間で相関がない場合に使用可能である。 Of the above first to fourth examples, the first example does not use θh 0 . This first example can be used, for example, when selecting initial items for a first adaptive test, or when there is no correlation between multiple competencies.

第2の例は、受検者に対して実行された適応型テストの最終推定値から定まる初期推定値θh0を基準としており、この初期推定値θh0に近い3つの項目が選択される。この第2の例において、選択される項目の困難度パラメータの間隔を0.5とした理由は、第1の例と異なり、θh0が算出されており、誤差を縮小可能なためである。第3の例は、困難度パラメータが初期推定値θh0に近い1つの項目のみが選択される。第1乃至第3の例は、すべて困難度パラメータのみに基づく初期項目の選択であるが、第4の例は、フィッシャー情報量に基づく初期項目の選択であり、困難度パラメータに加えて識別力パラメータと尤度が用いられる。第2乃至第4の例は、複数の能力間に所定レベル以上の相関がある場合に適用される。 In the second example, the initial estimated value θh 0 determined from the final estimated value of the adaptive test performed on the examinee is used as a reference, and three items close to this initial estimated value θh 0 are selected. In this second example, the reason why the interval between the difficulty level parameters of the selected items is set to 0.5 is that, unlike the first example, θh 0 is calculated and the error can be reduced. In a third example, only one item whose difficulty parameter is close to the initial estimate θh 0 is selected. All the first to third examples are the selection of initial items based only on the difficulty parameter, but the fourth example is the selection of the initial items based on the Fisher information amount, and the discriminative power is selected in addition to the difficulty parameter. Parameters and likelihoods are used. The second to fourth examples are applied when there is a predetermined level or more of correlation between a plurality of abilities.

各適応型テストにおいて、初期項目の選択には、第1乃至第4の例のいずれかを適用可能であり、初期項目の選択以降の項目選択には、上述した項目選択基準が適用される。 In each adaptive test, any of the first to fourth examples can be applied to the initial item selection, and the item selection criteria described above are applied to the item selection after the initial item selection.

<第2の実施形態に係る初期項目の選択>
第2の実施形態において、第2の能力を測定する場合、過去の受検者の第1の能力の能力値を説明変数、過去の受検者の第2の能力の能力値を目的変数とする単回帰式が用いられる。この単回帰式に現在の受検者の第1の能力の最終推定値を説明変数として代入することにより、第2の能力の初期推定値θ0が算出される。第2の適応型テストでは、この第2の能力の初期推定値θ0に対応する初期項目が用いられる。
<Selection of initial items according to the second embodiment>
In the second embodiment, when measuring the second ability, the ability value of the past examinee's first ability is an explanatory variable, and the ability value of the past examinee's second ability is an objective variable. A regression equation is used. By substituting the final estimated value of the first ability of the current examinee into this simple regression equation as an explanatory variable, the initial estimated value θ 0 of the second ability is calculated. The second adaptive test uses the initial term corresponding to this second initial estimate of ability θ 0 .

第2の実施形態において、第3の能力を測定する場合、過去の受検者の第1の能力の能力値と第2の能力の能力値を説明変数、第3の能力の能力値を目的変数とする重回帰式が用いられる。この重回帰式に現在の受検者の第1の能力の最終推定値及び第2の能力の最終推定値を説明変数として代入することにより、第3の能力の初期推定値θ0が算出される。第3の適応型テストでは、この第3の能力の初期推定値θ0に対応する初期項目が用いられる。 In the second embodiment, when measuring the third ability, the ability value of the past examinee's first ability and the ability value of the second ability are the explanatory variables, and the ability value of the third ability is the objective variable. A multiple regression equation is used. By substituting the final estimated value of the first ability and the final estimated value of the second ability of the current examinee into this multiple regression equation as explanatory variables, the initial estimated value θ 0 of the third ability is calculated. . The third adaptive test uses the initial item corresponding to the initial estimate θ 0 of this third ability.

第4以降の能力を測定する場合も、第3の能力の測定と同様である。
上記の単回帰式及び重回帰式は、過去の受検者の実測データから予め設定されている。
The measurement of the fourth and subsequent abilities is similar to the measurement of the third ability.
The above-mentioned simple regression equation and multiple regression equation are set in advance from actual measurement data of past examinees.

<能力の推定法>
以下で、第nの能力に対する第nの適応型テストで実行される能力推定を、第n-1の能力に対する適応型テストで算出された最終推定値に基づいて得られる事前分布を用いて実行することを説明する。
<Ability Estimation Method>
In the following, the ability estimation performed in the nth adaptive test for the nth ability is performed using the prior obtained based on the final estimate calculated in the adaptive test for the n-1th ability. explain what to do.

例えば、最初に実行される第1の適応型テストでは、上記の第1の例にしたがって初期項目が選択され、事前分布を標準正規分布としてEAP推定法により能力推定が実行される。 For example, in the first adaptive test, which is performed first, initial items are selected according to the first example above, and capability estimation is performed by the EAP estimation method with the prior distribution as the standard normal distribution.

能力間に相関があり、上記の第2乃至第4の例のいずれかを用いて初期項目が選択される場合、既に測定済みの能力からある程度次の能力を予測可能である。このため、本実施形態においては、先に実行された適応型テストの最終推定値と回帰式とに基づいて次に実行される適応型テストの初期推定値が算出され、当該初期推定値に基づいて次に実行される適応型テストで用いられる事前分布が決定される。 If there is a correlation between abilities and the initial item is selected using any of the second through fourth examples above, then to some extent the next ability can be predicted from the already measured ability. Therefore, in the present embodiment, the initial estimated value of the adaptive test to be executed next is calculated based on the final estimated value of the previously executed adaptive test and the regression equation, and based on the initial estimated value determines the priors to be used in the next adaptive test run.

本実施形態では、回帰モデルから予測した能力の初期推定値θh0と、(13)式及び(14)式によって与えられる回帰モデルにおける目的変数の予測誤差の標準誤差の推定値σhとを用いて、事前分布は、N(θh0,σh2)と表記される。この事前分布を用いて、EAP推定法により、能力推定が実行される。 In this embodiment, using the initial estimated value θh 0 of the ability predicted from the regression model and the estimated standard error of the prediction error of the objective variable in the regression model given by equations (13) and (14) σh , the prior distribution is denoted as N(θh 0 , σh 2 ). Using this prior distribution, capability estimation is performed by the EAP estimation method.

Figure 0007290272000015
Figure 0007290272000015

Figure 0007290272000016
Figure 0007290272000016

ここで、(13)式は単回帰モデルの場合に用いられる式であり、(14)式は重回帰モデルの場合に用いられる式である。nは受検者数、pは目的変数の自由度、sseは誤差の平方和、ssxは説明変数の平方和、xaは説明変数の平均、x0は受検者の目的変数の値とする。Di2はマハラノビス距離の2乗を表しており、(15)式で定義される。 Here, equation (13) is an equation used in the case of a simple regression model, and equation (14) is an equation used in the case of a multiple regression model. n is the number of examinees, p is the degree of freedom of the objective variable, sse is the sum of squares of errors, ss x is the sum of squares of the explanatory variables, xa is the mean of the explanatory variables, and x0 is the value of the subject's objective variable. . Di 2 represents the square of the Mahalanobis distance and is defined by equation (15).

Figure 0007290272000017
Figure 0007290272000017

ここで、ssjkは、説明変数間の分散共分散行列の逆行列の(i,j)成分である。 Here, ss jk is the (i, j) component of the inverse matrix of the variance-covariance matrix between explanatory variables.

<先行技術と本実施形態との対比>
非特許文献1及び非特許文献2は、回帰モデルを用いて次の能力推定をはじめる項目の選定を行う方法及び複数の能力の測定順序を決定する方法を説明している。
<Comparison between the prior art and the present embodiment>
Non-Patent Literature 1 and Non-Patent Literature 2 describe a method of selecting an item for starting the next ability estimation using a regression model and a method of determining the measurement order of a plurality of abilities.

非特許文献1は、複数の能力分野を扱う到達度テストのための適応型テストを説明しており、複数の能力間の関係に回帰モデルを適用し、複数の能力分野の項目を項目選択基準によって組み合わせて提示することを主な手法としている。データシミュレーションでは、12個の能力に分けられた232項目のテストを、紙面上で、365名の海軍の防火技術者に実施した結果を用いて、テストの情報量とテスト時間の長さの観点から適応型テストと従来のテストとを比較している。このシミュレーションの結果、複数の受検者間の相関に対して複数の能力間の関係に回帰モデルの適用を保証することは十分とはいえず、12個の能力のテストそれぞれの項目数が異なっていても2つの能力間の情報量に大きな差異はみられなかった。項目の中には、測定精度がよくならない項目もある。このシミュレーションでは、そのような精度の低い項目を用いる必要性がないことが明らかとなった。適応型テストで使用された項目は、平均して従来のテストの半分程度であり、その中で最小のものは18%、最大のものは80%であった。しかし、適応型テストから得られた情報曲線が従来のテストから得られた情報曲線に対して、本質的に意味をもつものとはならなかった。すなわち、この非特許文献1の方法は、従来の方法と比較して試験時間の大幅な減少には寄与したが、能力の測定精度が低下するため、適応型テストの初期段階における能力推定の方法及び項目選択基準に課題があった。 Non-Patent Document 1 describes an adaptive test for attainment testing that deals with multiple competence areas, applies a regression model to the relationship between multiple competence areas, and uses items in multiple competency areas as item selection criteria. The main method is to combine and present by In the data simulation, 232 items of tests divided into 12 abilities were conducted on paper for 365 Navy fire protection engineers, and the amount of information in the test and the length of the test time were examined. compares adaptive tests with conventional tests. As a result of this simulation, it was not sufficient to guarantee the application of the regression model to the relationship between multiple abilities against the correlation between multiple test takers, and the number of items in each of the 12 ability tests was different. However, there was no significant difference in the amount of information between the two abilities. Among the items, there are items for which the measurement accuracy is not improved. This simulation revealed that there was no need to use such low-precision terms. On average, the adaptive test used about half as many items as the conventional test, with the smallest being 18% and the largest being 80%. However, the information curve obtained from the adaptive test was not intrinsically meaningful with respect to the information curve obtained from the conventional test. That is, the method of Non-Patent Document 1 contributed to a significant reduction in the test time compared to the conventional method, but because the accuracy of measurement of ability decreases, the method of ability estimation in the initial stage of adaptive testing And there were issues with item selection criteria.

非特許文献2では、適応型テストを従来のテストと比較し、その利点を説明している。適応型テストは、カウンセリング又は教育などの様々な場面で個々の受検者の行動又は学生の達成度、理解度、教育による結果としての業績の変化を測定する場合に、テスト時間を短縮する。具体例として、ASRT(Adaptive SelfReferenced Testing)が挙げられている。ASRTでは、読書や数学など12の能力分野の測定を行い、学生に対してこれらの分野の中で関心がある分野の測定を一連のテスト項目で行う。1回目は一般的な適応型テストとして行い、後日再び同じ学生にこのテストを行うときは、以前のテストで提示した項目を除いて測定する。2回目以降のテストの初期能力値は、前回のテストの推定値を用いており、この推定値と有意な変化が生じたとき、あるいは推定値が固定されたときに測定を終了する。この過程を毎回行うことにより、学生の変化の状況を追跡することができる。 Non-Patent Document 2 compares adaptive testing with conventional testing and explains its advantages. Adaptive tests reduce test time when measuring changes in individual test-taker behavior or student achievement, comprehension, and performance as a result of education in a variety of settings, such as counseling or education. A specific example is ASRT (Adaptive Self-Referenced Testing). The ASRT measures 12 skill areas, such as reading and mathematics, and asks students to measure their areas of interest in these areas with a series of test items. The first test is conducted as a general adaptive test, and when the same students are given this test again at a later date, the items presented in the previous test are excluded from the measurement. The initial performance values for the second and subsequent tests use the estimated values from the previous test, and the measurement ends when there is a significant change from this estimated value, or when the estimated value is fixed. By doing this process each time, it is possible to track the status of changes in the student.

非特許文献3乃至非特許文献5では、能力の推定を効率化する多次元適応型テストが説明されている。 Non-Patent Documents 3 to 5 describe multi-dimensional adaptive tests that streamline ability estimation.

多次元適応型テストは、測定する各能力間に相関があることを用いて、1項目提示する度にその反応から提示した項目に該当する能力のみではなく、多次元適応型テストにおいて測定されるすべての能力を測定する。 A multidimensional adaptive test uses the fact that there is a correlation between each ability to be measured, and not only the ability corresponding to the presented item from the response each time one item is presented, but also the multidimensional adaptive test is measured. Measure all abilities.

このように、多次元適応型テストでは、1項目ごとにすべての能力を推定するため、計算量が多くなり、処理を行うサーバの負荷が大きくなる。計算量の増加は、測定する能力数が多くなるほど顕著になる。 In this way, in the multidimensional adaptive test, since all abilities are estimated for each item, the amount of calculation increases and the load on the server that performs the processing increases. The increase in computational complexity becomes more pronounced as the number of capabilities to be measured increases.

また、多次元適応型テストでは、次に提示される項目がどの能力を測定するための項目であるかを認識することが困難であり、受検者が戸惑う可能性がある。多次元適応型テストは、各能力を測定するために事前に例を提示したい場合などのように、各能力に関する項目をランダムに提示することが適当でない場合に、使用することが適切ではない。 In addition, in the multidimensional adaptive test, it is difficult for the examinee to recognize which ability the next item is to measure, which may confuse the examinee. Multidimensional adaptive tests are not suitable for use when random presentation of items for each ability is not appropriate, such as when you want to present examples in advance to measure each ability.

本実施形態に係る能力測定処理では、適応型テストにより複数の能力を測定する場合に、テスト時間が長くなることを抑制する。本実施形態に係る能力測定処理では、複数の能力間で相関が強い場合に、受検者に提示される項目の数を削減可能である。 In the ability measurement process according to this embodiment, when a plurality of abilities are measured by the adaptive test, lengthening of the test time is suppressed. In the ability measurement process according to the present embodiment, it is possible to reduce the number of items presented to the examinee when there is a strong correlation between a plurality of abilities.

本実施形態に係る能力測定処理では、最初の適応型テストでは、例えば平均的な能力値であるゼロを能力の初期推定値と仮定して適応型テストが開始される。2個目以降の能力を測定する場合、能力間の相関関係に基づくデータから求めた回帰式と、実行済みの適応型テストの結果とを用いて初期推定値が算出され、初期推定値を用いて次に実行される適応型テストの初期項目が選択される。 In the ability measurement process according to the present embodiment, in the first adaptive test, the adaptive test is started by assuming, for example, an average ability value of zero as an initial estimated value of ability. When measuring the second and subsequent abilities, an initial estimate is calculated using the regression equation obtained from the data based on the correlation between abilities and the results of the adaptive tests that have been performed, and the initial estimate is used. selects the initial item for the next adaptive test to be run.

適応型テストにおいては、能力を推定する際の事前分布として例えば標準正規分布が利用される。本実施形態に係る能力測定処理では、能力の初期推定値を平均とし、初期推定値を求めるための回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布が、能力推定の際に用いられる。 Adaptive testing uses, for example, the standard normal distribution as a prior distribution for estimating ability. In the ability measurement process according to the present embodiment, the prior distribution with the initial estimated value of ability as the average and the standard deviation of the prediction error of the objective variable in the regression equation for obtaining the initial estimated value is used as the prior distribution when estimating ability. used for

上記のような本実施形態に係る能力測定処理においては、上記の非特許文献1から非特許文献5の課題を解消しつつ、効率よく、かつ、精度よく複数の能力測定を行うことができる。本実施形態に係る能力測定処理では、測定される各能力とその項目との関係が明確であるため、能力測定の前に例を提示するなど、受検者が理解しやすい測定を行うことができる。 In the ability measurement process according to the present embodiment as described above, it is possible to perform a plurality of ability measurements efficiently and accurately while solving the problems of Non-Patent Documents 1 to 5 described above. In the ability measurement process according to the present embodiment, since the relationship between each ability to be measured and its item is clear, it is possible to perform measurement that is easy for the examinee to understand, such as by presenting an example before the ability measurement. .

<まとめ>
以上説明した本実施形態においては、複数の能力を複数の適応型テストを用いて測定する場合に、各能力に強い相関関係があることを用いて、受検者に提示される項目数を削減することができ、適応型テストの効率を向上させることができる。
<Summary>
In the present embodiment described above, when a plurality of abilities are measured using a plurality of adaptive tests, the fact that each ability has a strong correlation is used to reduce the number of items presented to the examinee. can improve the efficiency of adaptive testing.

本実施形態においては、ある能力の最終推定値が算出された後、次の能力を測定する場合に、この次の能力の前に測定された最終推定値に基づいて初期推定値が算出される。次の能力の測定では、算出された初期推定値を用いて初期項目が選択され、事前分布が決定され、ベイズ法を用いた能力推定により能力の推定値が算出される。初期項目の選択については、第1乃至第4の例を説明したが、シミュレーションの結果、最も効果を発揮したのは第4の例であった。 In this embodiment, after the final estimated value of a certain ability is calculated, when measuring the next ability, the initial estimated value is calculated based on the final estimated value measured before this next ability. . For subsequent performance measurements, initial items are selected using the computed initial estimates, prior distributions are determined, and performance estimates are computed using Bayesian performance estimation. Regarding the selection of the initial items, the first to fourth examples were explained, but the result of the simulation was that the fourth example was the most effective.

能力の推定に用いられる事前分布は、平均を当該能力の初期推定値、標準偏差を回帰モデルにおける目的変数の予測誤差の分散の推定値とする正規分布を用いることができる。
項目選択基準に関しては、サーバに与える負荷と項目数の削減の程度を総合的に考慮すると、MFIを用いることが好ましい。
As the prior distribution used for estimating ability, a normal distribution can be used in which the mean is the initial estimate of the ability and the standard deviation is the estimated variance of the prediction error of the objective variable in the regression model.
Regarding the item selection criteria, it is preferable to use MFI when comprehensively considering the load on the server and the degree of reduction in the number of items.

上記のような条件で本実施形態に係る能力測定処理を実行した場合、従来は一人あたり平均26.5項目程度を提示する必要があるテストを、平均20~22項目程度に削減できることができた。 When the ability measurement process according to the present embodiment is executed under the above conditions, the number of tests that conventionally required about 26.5 items per person on average can be reduced to about 20 to 22 items on average. .

本実施形態においては、テスト時間が短縮化されるため、受検者の疲労及び集中力の低下などのような測定を妨げる要因を小さくすることができ、受検者は十分に力を発揮することができる。 In this embodiment, since the test time is shortened, it is possible to reduce factors that hinder the measurement, such as examinee's fatigue and reduced concentration, so that the examinee can fully exert his/her ability. can.

テストの運用者は、選択される項目数が少なくなれば項目内容の暴露が低減されるため、項目プールの維持、更新、拡張などの管理負荷を軽減することができる。また、限られた時間で複数の能力を測定することができるため、適応型テストを導入可能な機会を増やすことができる。また、テストの運用者は、テストの時間が短縮されることにより、テストの実行回数を増やすことができ、設備の回転率を上げることができ、利益を増やすことができる。 The test operator can reduce the administrative burden of maintaining, updating, and expanding the item pool because the exposure of item content is reduced when the number of selected items is reduced. In addition, since multiple abilities can be measured in a limited amount of time, opportunities for introducing adaptive tests can be increased. In addition, the test operator can increase the number of test executions by shortening the test time, increase the turnover rate of the equipment, and increase profits.

多次元適応型テストは、受検者に提示された項目に関連する能力及び分野が定まらないという特徴を持つが、本実施形態においては、受験者に提示される項目の能力及び分野を分けることができるため、能力ごとに、事前説明、例題の提示又は練習を行ってからテストを行うことができる。 A multidimensional adaptive test is characterized in that the abilities and fields related to the items presented to the examinee are not fixed, but in this embodiment, the abilities and fields of the items presented to the examinee can be divided. Therefore, it is possible to conduct a test after giving explanations, presenting example questions, or practicing for each ability.

なお、本発明は上記で説明した実施形態に限定されず、各実施形態は、構成要素を削除、付加又は変更等をして実施することができる。また、各実施形態の各構成要素を適宜組み合わせ又は交換などをすることで、さらに異なる形態で実施することができる。このように、上記で説明した実施形態と直接的には異なる実施形態であっても、本発明と同様の趣旨のものは、本発明の実施形態として説明したものとして、その説明を省略している。 It should be noted that the present invention is not limited to the embodiments described above, and each embodiment can be implemented by deleting, adding, or changing constituent elements. Also, by appropriately combining or exchanging each component of each embodiment, it is possible to implement it in a further different form. In this way, even if the embodiments are directly different from the embodiments described above, those having the same meaning as the present invention are described as the embodiments of the present invention, and the description thereof is omitted. there is

1…能力測定装置、2…入力装置、3…出力装置、4…記憶装置、5…処理装置、6…バス、7…プログラム、8…項目プール、9…回答データ、10…推定データ、111…第1の能力測定データ、112…第2の能力測定データ、113…第3の能力測定データ、121…第1の回帰モデル、122…第2の回帰モデル、13a、13b…初期項目データ、14a、14b…事前分布データ、15…制御部、161…第1の能力測定部、162…第2の能力測定部、163…第3の能力測定部、17…初期項目選択部、18…事前分布決定部。 DESCRIPTION OF SYMBOLS 1...Ability measuring device 2...Input device 3...Output device 4...Storage device 5...Processing device 6...Bus 7...Program 8...Item pool 9...Answer data 10...Estimated data 111 ... first ability measurement data, 112 ... second ability measurement data, 113 ... third ability measurement data, 121 ... first regression model, 122 ... second regression model, 13a, 13b ... initial item data, 14a, 14b prior distribution data 15 control unit 161 first ability measurement unit 162 second ability measurement unit 163 third ability measurement unit 17 initial item selection unit 18 prior Distribution determination part.

Claims (7)

複数の能力の測定に用いられる複数の項目を含む項目データを記憶する記憶装置と、
前記項目データを用いて、前記複数の能力のそれぞれに関する適応型テストを実行する処理装置と、
を具備し、
前記複数の能力は、第1の能力と、前記第1の能力より後に測定される第2の能力と、前記第2の能力より後に測定される第3の能力とを含み、
前記処理装置は、
前記第1の能力に対する第1の適応型テストの第1の最終推定値に基づいて、前記第2の能力に対する第2の適応型テストの初期項目を選択し、前記第2の適応型テストの能力推定で用いられる事前分布を決定し、
前記第2の適応型テストの第2の最終推定値に基づいて、前記第3の能力に対する第3の適応型テストの初期項目を選択し、前記第3の適応型テストの能力推定で用いられる事前分布を決定し、
前記処理装置は、
前記第1の最終推定値と第1の回帰式とに基づいて、前記第2の適応型テストの初期推定値を算出し、前記第2の適応型テストの初期推定値に基づいて、前記第2の適応型テストの初期項目を選択し、
前記第2の最終推定値と第2の回帰式とに基づいて、前記第3の適応型テストの初期推定値を算出し、前記第3の適応型テストの初期推定値に基づいて、前記第3の適応型テストの初期項目を選択し、
前記処理装置は、
前記第2の適応型テストの初期推定値を平均値とし、前記第1の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を、前記第2の適応型テストの能力推定で用いられる前記事前分布とし、
前記第3の適応型テストの初期推定値を平均値とし、前記第2の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を、前記第3の適応型テストの能力推定で用いられる前記事前分布とする、
能力測定装置。
a storage device for storing item data including a plurality of items used for measuring a plurality of abilities;
a processing device that executes an adaptive test for each of the plurality of abilities using the item data;
and
The plurality of abilities includes a first ability, a second ability measured after the first ability, and a third ability measured after the second ability,
The processing device is
selecting an initial item for a second adaptive test for the second ability based on a first final estimate of the first adaptive test for the first ability; determine the prior distribution used in ability estimation,
selecting an initial item of a third adaptive test for the third ability based on a second final estimate of the second adaptive test to be used in the ability estimation of the third adaptive test determine the prior distribution ,
The processing device is
calculating an initial estimate of the second adaptive test based on the first final estimate and the first regression equation; and calculating an initial estimate of the second adaptive test based on the initial estimate of the second adaptive test; Select the initial item of the adaptive test of 2,
calculating an initial estimate of the third adaptive test based on the second final estimate and a second regression equation; and calculating an initial estimate of the third adaptive test based on the initial estimate of the third adaptive test; Select the initial item of the adaptive test of 3,
The processing device is
The ability estimation of the second adaptive test is a prior distribution with the initial estimated value of the second adaptive test as the mean value and the standard error of the prediction error of the objective variable in the first regression equation as the standard deviation. Let the prior distribution used in
The ability estimation of the third adaptive test is a prior distribution with the initial estimated value of the third adaptive test as the mean value and the standard error of the prediction error of the objective variable in the second regression equation as the standard deviation. Let the prior distribution used in
Ability measuring device.
前記処理装置は、
前記第2の適応型テストの能力推定及び前記第3の適応型テストの能力推定でベイズ法を用い、
前記第2の適応型テストの初期推定値に対してフィッシャー情報量が最大となる項目を、前記第2の適応型テストの初期項目として選択し、
前記第3の適応型テストの初期推定値に対してフィッシャー情報量が最大となる項目を、前記第3の適応型テストの初期項目として選択する、
請求項の能力測定装置。
The processing device is
Using a Bayesian method in the ability estimation of the second adaptive test and the ability estimation of the third adaptive test,
selecting the item with the maximum Fisher information amount for the initial estimate of the second adaptive test as the initial item of the second adaptive test;
Selecting the item with the maximum Fisher information for the initial estimate of the third adaptive test as the initial item of the third adaptive test;
The ability measuring device according to claim 1 .
複数の能力の測定に用いられる複数の項目を含む項目データを記憶する記憶装置と、 a storage device for storing item data including a plurality of items used for measuring a plurality of abilities;
前記項目データを用いて、前記複数の能力のそれぞれに関する適応型テストを実行する処理装置と、 a processing device that executes an adaptive test for each of the plurality of abilities using the item data;
を具備し、and
前記複数の能力は、第1の能力と、前記第1の能力より後に測定される第2の能力と、前記第2の能力より後に測定される第3の能力とを含み、 The plurality of abilities includes a first ability, a second ability measured after the first ability, and a third ability measured after the second ability,
前記処理装置は、 The processing device is
前記第1の能力に対する第1の適応型テストの第1の最終推定値に基づいて、前記第2の能力に対する第2の適応型テストの初期項目を選択し、前記第2の適応型テストの能力推定で用いられる事前分布を決定し、 selecting an initial item for a second adaptive test for the second ability based on a first final estimate of the first adaptive test for the first ability; determine the prior distribution used in ability estimation,
前記第1の最終推定値及び前記第2の適応型テストの第2の最終推定値に基づいて、前記第3の能力に対する第3の適応型テストの初期項目を選択し、前記第3の適応型テストの能力推定で用いられる事前分布を決定し、 selecting an initial item for a third adaptive test for the third ability based on the first final estimate and a second final estimate of the second adaptive test; determine the prior distribution used in proficiency estimation for the type test;
前記処理装置は、 The processing device is
前記第1の最終推定値と第1の回帰式とに基づいて、前記第2の適応型テストの初期推定値を算出し、前記第2の適応型テストの初期推定値に基づいて、前記第2の適応型テストの初期項目を選択し、 calculating an initial estimate of the second adaptive test based on the first final estimate and the first regression equation; and calculating an initial estimate of the second adaptive test based on the initial estimate of the second adaptive test; Select the initial item of the adaptive test of 2,
前記第1の最終推定値と前記第2の最終推定値と第2の回帰式とに基づいて、前記第3の適応型テストの初期推定値を算出し、前記第3の適応型テストの初期推定値に基づいて、前記第3の適応型テストの初期項目を選択し、 calculating an initial estimate of the third adaptive test based on the first final estimate, the second final estimate, and a second regression equation; and calculating an initial estimate of the third adaptive test selecting an initial item for the third adaptive test based on the estimate;
前記処理装置は、 The processing device is
前記第2の適応型テストの初期推定値を平均値とし、前記第1の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を、前記第2の適応型テストの能力推定で用いられる前記事前分布とし、 The ability estimation of the second adaptive test is a prior distribution with the initial estimated value of the second adaptive test as the mean value and the standard error of the prediction error of the objective variable in the first regression equation as the standard deviation. Let the prior distribution used in
前記第3の適応型テストの初期推定値を平均値とし、前記第2の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする事前分布を、前記第3の適応型テストの能力推定で用いられる前記事前分布とする、 The ability estimation of the third adaptive test is a prior distribution with the initial estimated value of the third adaptive test as the mean value and the standard error of the prediction error of the objective variable in the second regression equation as the standard deviation. Let the prior distribution used in
能力測定装置。Ability measuring device.
前記処理装置は、 The processing device is
前記第2の適応型テストの能力推定及び前記第3の適応型テストの能力推定でベイズ法を用い、 Using a Bayesian method in the ability estimation of the second adaptive test and the ability estimation of the third adaptive test,
前記第2の適応型テストの初期推定値に対してフィッシャー情報量が最大となる項目を、前記第2の適応型テストの初期項目として選択し、 selecting the item with the maximum Fisher information amount for the initial estimate of the second adaptive test as the initial item of the second adaptive test;
前記第3の適応型テストの初期推定値に対してフィッシャー情報量が最大となる項目を、前記第3の適応型テストの初期項目として選択する、 Selecting the item with the maximum Fisher information for the initial estimate of the third adaptive test as the initial item of the third adaptive test;
請求項3の能力測定装置。4. The ability measuring device according to claim 3.
前記第2の回帰式は、前記第1の最終推定値と前記第2の最終推定値とに基づいて前記第3の適応型テストの初期項目を選択するための重回帰式を含む、請求項3の能力測定装置。4. The second regression equation comprises a multiple regression equation for selecting initial items for the third adaptive test based on the first final estimate and the second final estimate. 3 ability measuring device. コンピュータに、
記憶装置に記憶されている項目データから第1の能力の測定に用いられる項目を選択する第1の適応型テストを実行する機能と、
前記第1の適応型テストの第1の最終推定値と第1の回帰式とに基づいて、前記第1の能力より後に測定される第2の能力に対する第2の適応型テストの初期推定値を算出し、前記第2の適応型テストの初期推定値に基づいて、前記第2の適応型テストの初期項目を選択し、前記第2の適応型テストの初期推定値を平均値とし、前記第1の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする分布を前記第2の適応型テストの能力推定で用いられる事前分布として決定する機能と、
前記第2の適応型テストの初期項目と、前記第2の適応型テストの能力推定で用いられる前記事前分布と、前記記憶装置に記憶されている前記項目データとに基づいて、前記第2の適応型テストを実行する機能と、
前記第2の適応型テストの第2の最終推定値と第2の回帰式とに基づいて、前記第2の能力より後に測定される第3の能力に対する第3の適応型テストの初期推定値を算出し、前記第3の適応型テストの初期推定値に基づいて、前記第3の適応型テストの初期項目を選択し、前記第3の適応型テストの初期推定値を平均値とし、前記第2の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする分布を前記第3の適応型テストの能力推定で用いられる事前分布として決定する機能と、
前記第3の適応型テストの初期項目と、前記第3の適応型テストの能力推定で用いられる前記事前分布と、前記記憶装置に記憶されている前記項目データとに基づいて、前記第3の適応型テストを実行する機能と、
を実現させるためのプログラム。
to the computer,
a function of executing a first adaptive test that selects items used to measure the first ability from the item data stored in the storage device;
An initial estimate of a second adaptive test for a second ability measured after the first ability based on a first final estimate of the first adaptive test and a first regression equation. and selecting an initial item for the second adaptive test based on the initial estimate for the second adaptive test, taking the initial estimate for the second adaptive test as an average value, and A function of determining a distribution whose standard deviation is the standard error of the prediction error of the objective variable in the first regression equation as the prior distribution used in the ability estimation of the second adaptive test;
Based on the initial item of the second adaptive test, the prior distribution used in ability estimation of the second adaptive test, and the item data stored in the storage device, the second the ability to run adaptive tests for
An initial estimate of a third adaptive test for a third ability measured after the second ability based on a second final estimate of the second adaptive test and a second regression equation. and selecting an initial item for the third adaptive test based on the initial estimate for the third adaptive test, taking the initial estimate for the third adaptive test as an average value, and A function of determining a distribution whose standard deviation is the standard error of the prediction error of the objective variable in the second regression equation as the prior distribution used in the ability estimation of the third adaptive test;
Based on the initial items of the third adaptive test, the prior distribution used in ability estimation of the third adaptive test, and the item data stored in the storage device, the third the ability to run adaptive tests for
program to make it happen.
コンピュータにより、記憶装置に記憶されている項目データから第1の能力の測定に用いられる項目を選択する第1の適応型テストを実行することと、
前記コンピュータにより、前記第1の適応型テストの第1の最終推定値と第1の回帰式と前記記憶装置に記憶されている前記項目データとに基づいて、前記第1の能力より後に測定される第2の能力に対する第2の適応型テストの初期推定値を算出し、前記第2の適応型テストの初期推定値に基づいて、前記第2の適応型テストの初期項目を選択し、前記第2の適応型テストの初期推定値を平均値とし、前記第1の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする分布を前記第2の適応型テストの能力推定で用いられる事前分布として決定することと、
前記コンピュータにより、前記第2の適応型テストの初期項目と、前記第2の適応型テストの能力推定で用いられる前記事前分布と、前記記憶装置に記憶されている前記項目データとに基づいて、前記第2の適応型テストを実行することと、
前記コンピュータにより、前記第2の適応型テストの第2の最終推定値と第2の回帰式と前記記憶装置に記憶されている前記項目データとに基づいて、前記第2の能力より後に測定される第3の能力に対する第3の適応型テストの初期推定値を算出し、前記第3の適応型テストの初期推定値に基づいて、前記第3の適応型テストの初期項目を選択し、前記第3の適応型テストの初期推定値を平均値とし、前記第2の回帰式における目的変数の予測誤差の標準誤差を標準偏差とする分布を前記第3の適応型テストの能力推定で用いられる事前分布として決定することと、
前記コンピュータにより、前記第3の適応型テストの初期項目と、前記第3の適応型テストの能力推定で用いられる前記事前分布と、前記記憶装置に記憶されている前記項目データとに基づいて、前記第3の適応型テストを実行することと、
を具備する能力測定方法。
executing, by a computer, a first adaptive test that selects items used to measure the first ability from item data stored in a storage device;
measured by the computer after the first ability based on the first final estimate of the first adaptive test , the first regression equation , and the item data stored in the storage device calculating an initial estimate of a second adaptive test for a second ability in which the A distribution with an initial estimated value of the second adaptive test as the mean value and a standard deviation as the standard error of the prediction error of the objective variable in the first regression equation is used in estimating the ability of the second adaptive test. determining as a prior distribution;
by the computer, based on the initial items of the second adaptive test, the prior distribution used in estimating ability of the second adaptive test, and the item data stored in the storage device; , performing the second adaptive test;
measured by the computer after the second ability based on a second final estimate of the second adaptive test , a second regression equation, and the item data stored in the storage device calculating an initial estimate of a third adaptive test for a third ability that A distribution with an initial estimated value of the third adaptive test as the mean value and a standard deviation as the standard error of the prediction error of the objective variable in the second regression equation is used in the ability estimation of the third adaptive test. determining as a prior distribution;
By the computer, based on the initial items of the third adaptive test, the prior distribution used in estimating ability of the third adaptive test, and the item data stored in the storage device , performing said third adaptive test;
Ability measurement method comprising
JP2019112144A 2019-06-17 2019-06-17 Ability measuring device, program and method Active JP7290272B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019112144A JP7290272B2 (en) 2019-06-17 2019-06-17 Ability measuring device, program and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019112144A JP7290272B2 (en) 2019-06-17 2019-06-17 Ability measuring device, program and method

Publications (2)

Publication Number Publication Date
JP2020204703A JP2020204703A (en) 2020-12-24
JP7290272B2 true JP7290272B2 (en) 2023-06-13

Family

ID=73837959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019112144A Active JP7290272B2 (en) 2019-06-17 2019-06-17 Ability measuring device, program and method

Country Status (1)

Country Link
JP (1) JP7290272B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7387101B2 (en) * 2021-12-09 2023-11-28 株式会社ナスピア Text answer question automatic scoring system and its method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209297A (en) 2000-01-24 2001-08-03 Human Resource Research Institute Inc Computer adaptive test device, computer adaptive test system, computer adaptive test method, and recording medium storing computer adaptive test program
JP2004527049A (en) 2001-04-20 2004-09-02 エデュケーショナル テスティング サービス How to diagnose latent characteristics
US20150161901A1 (en) 2013-12-06 2015-06-11 Act, Inc. Methods for improving test efficiency and accuracy in a computer adaptive test (cat)
US20160035236A1 (en) 2014-07-31 2016-02-04 Act, Inc. Method and system for controlling ability estimates in computer adaptive testing providing review and/or change of test item responses

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209297A (en) 2000-01-24 2001-08-03 Human Resource Research Institute Inc Computer adaptive test device, computer adaptive test system, computer adaptive test method, and recording medium storing computer adaptive test program
JP2004527049A (en) 2001-04-20 2004-09-02 エデュケーショナル テスティング サービス How to diagnose latent characteristics
US20150161901A1 (en) 2013-12-06 2015-06-11 Act, Inc. Methods for improving test efficiency and accuracy in a computer adaptive test (cat)
US20160035236A1 (en) 2014-07-31 2016-02-04 Act, Inc. Method and system for controlling ability estimates in computer adaptive testing providing review and/or change of test item responses

Also Published As

Publication number Publication date
JP2020204703A (en) 2020-12-24

Similar Documents

Publication Publication Date Title
Duffy et al. Learning, information, and sorting in market entry games: theory and evidence
JP6960688B2 (en) Machine learning methods, devices and computer programs for providing personalized educational content based on learning efficiency
Buhai Quantile regression: overview and selected applications
US10885803B2 (en) System and method for real-time analysis and guidance of learning
Davey A Guide to Computer Adaptive Testing Systems.
US8348674B2 (en) Test discrimination and test construction for cognitive diagnosis
Yoshioka et al. An adaptive test analysis based on students' motivation
Fox Applications of multilevel IRT modeling
Asriadi et al. Implementation of item response theory at final exam test in physics learning: Rasch model study
JP7290272B2 (en) Ability measuring device, program and method
Kumar et al. Prediction of student final exam performance in an introductory programming course: Development and validation of the use of a support vector machine-regression model
Vermeiren et al. Balancing stability and flexibility: Investigating a dynamic K value approach for the Elo rating system in adaptive learning environments
Bolsinova et al. Using expert knowledge for test linking.
Van Daal Making a choice is not easy?! Unravelling the task difficulty of comparative judgement to assess student work
YAMAUCHI et al. Nudge messages for e-learning engagement and student’s personality traits: Effects and implication for personalization
Morrison Comparing elo, glicko, irt, and bayesian irt statistical models for educational and gaming data
JP7039015B2 (en) Teaching material learning schedule determination device
KR101895963B1 (en) Method for analysis of new users
JP2017207691A (en) Correct answer ratio prediction method of multiple-choice question
Zitzmann et al. Novick meets Bayes: Improving the assessment of individual students in educational practice and research by capitalizing on assessors’ prior beliefs
Thijssen et al. Recommendation system in an integrated digital training environment for the 5th generation air force
PANKIEWICZ A warm-up for adaptive online learning environments–the Elo rating approach for assessing the cold start problem
Umobong The One-Parameter Logistic Model (1PLM) and its application in test development
Nursuhud et al. Empirical Analysis of Diagramatic Representation Test Instruments Using Partial Credit Model in Realizing Learning Outcomes.
Yalçin Use of Mixed Item Response Theory in Rating Scales.

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20190701

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230524

R150 Certificate of patent or registration of utility model

Ref document number: 7290272

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150