国立国会図書館から提供されるJAPAN/MARCデータに問題が発生している場合があるため、
国立国会図書館のシステム上でチェックができていない部分について、
J-BISCサポートセンターにてチェック用のツールを開発し、
毎週のデータをチェックするとともに、
同ツールを国立国会図書館にも提供し、提供される前のデータをチェックしております。
(1) フィールド245 タイトル等の正規フィールドと
フィールド880 読みフィールドの対応のチェック
また、6nn件名標目、7nn著者標目、8nnシリーズ著者標目において
$0(典拠レコード管理番号)がない場合エラー
→err1201n.txt(2012-01号新規データのエラーリスト)
(2) レコード管理番号のチェック
・フィールド001レコード管理番号に数字以外が含まれている場合エラーとする
(3) 6nn件名標目、7nn著者標目、8nnシリーズ著者標目について
・$0 典拠レコード管理番号があり、かつ
・$6 読みの対応関係がなく、かつ
・$a に「カナ」「かな」「漢字」が含まれる場合エラーとする
・6nn 7nn 8nnのうちJAPAN/MARCマニュアルにおいて$0が必須の項目について
$0をチェックし、なければエラーとします。
(4) field 245および260のサブフィールド$cがある場合、
$cの後ろに他のサブフィールドは存在しない。存在する場合エラーとする。
※但しサブフィールド$6は除く。
(2012/04/19時点で全件データをチェックした際のエラーリストです)
→allchk245c.txt
→allchk260c.txt
(5) field 6nn 7nn の$0典拠番号について、数字以外の文字が入っていた場合エラーとする 対応する880と$0の典拠番号が異なる場合エラーとする。
(6) 同一ファイル内の001および015aのファイル内での重複をチェックする
→毎週の新規・更新データの重複チェックにのみ使用するため、1ファイル20480件目までをチェックする。
※全件データベース内でのチェックは別途実行しております。
(7) 不正改行が入ったデータ等、レコード長が正しくないデータ(=末尾がレコード区分文字(HEX1d)でないデータ)
を検出してエラーとします。
前後を検索してレコード区分文字が見つかった場合は次のレコードから処理を続行します。
見つからない場合は処理を終了します。
(8) レコード中に090a(請求記号)がなく、015a(JPNo)がある場合エラーとします。
(9) フィールド245が存在しない場合、または複数存在する場合エラーとします。
(10) JPNo先頭1桁が'0'でなくかつ'1'でないレコード(=JAPAN/MARC(M))で、 フィールド710に$0典拠番号がない場合エラーとします。
(11) フィールドNo015以上のフィールドにおいて インディケータの直後にサブフィールド識別子がない場合エラーとします。
(12) フィールド880にサブフィールド$6がない場合エラー。また、
フィールド880のサブフィールド$6に対応するオカレンス番号を持つフィールドがない場合エラーとします。
チェックプログラム作成当初(※前記(1)の段階)にJAPAN/MARC(A)の確認もあわせて実行しましたが、
「正規フィールドと読みフィールドの対応」に関して問題は確認されませんでした。
JAPAN/MARC(M)では著者・件名等の880を生成する際に外部レコード(典拠)を参照している
(→その際に問題が発生する)のに対して、JAPAN/MARC(A)では外部参照がないためです。
JAPAN/MARC(M)で発生している「正規フィールドと読みフィールドの対応の問題」は、
主にJAPAN/MARC(A)において「標目」と「参照指示」の項目において
同一の「読み」が存在する場合に発生することが判明しており、
ただ、NDLではチェックする方法(ツール)がありませんでした。
そのため、JAPAN/MARC(A)において上記の「読みの重複」をチェックするツールを作成し
NDLに提供しました。
チェックプログラム本体はJAPAN/MARC(M)用と同一のもので、
データ内容により(M)(S)と(A)を判定し処理を分けております。
環境変数の設定により以下の処理を実行します。
0.フィールド1nnと4nnの重複チェック、対応する読み(カナ)の重複チェック
1.フィールド1nnと4nn/5nnの重複チェック、対応する読み(カナ)の重複チェック
2.フィールド1nnと4nnに対応するローマ字の重複チェック
3.フィールド1nnと4nnに対応する読み(カナ)について、 カナの重複がなくローマ字が重複しているものをチェック
以上のチェック結果を元に典拠データの修正を進めて頂き、
著者典拠2012年第1回提供の時点(2012年7月)では
JAPAN/MARC(M)に影響する問題点はほぼ解消済みです。