八、題庫 |
本軟體以司法院提供之筆錄資料,經過修改後,做為基本練習題庫,供您平時練習使用,但您也可以自行準備題庫使用。以下說明本軟體基本練習題庫與原始筆錄內容的不同:
8.1 題庫內容 每個題庫,都「去頭去尾」,只取其中最重要的詢問對話內容。 第一行,是「案由」。(註:C0003.txt~C0030.txt沒有提供案由) 第二行起,是「對話內容」。可以依照名稱,知道題庫的內類別: C開頭檔案:刑事案件題庫。 M開頭檔案:民事案件題庫。 B開頭檔案:行政訴訟案件題庫。
8.2.1 檔案格式 須為一般文字檔案,附屬檔名為.TXT,檔案名稱要注意修改。
8.2.2 文件內碼 須為繁體中文字,全部字必須是標準Big5字集字,自造字將不發音,也會跳過不計分。所以題目中若有非Big5碼字,建議換掉該字。
8.2.3 發音 本軟體採用人工智慧「中文自然語意處理」技術,根據句子的前後文語意,判斷最適當的中文讀音,包含破音字、連續三聲字變調等,正確率約可達99%,但受限於語言的的複雜度與特殊性,但無法達到100%。所以部分測驗題目內容單字有做部分修正,避開破音字朗讀錯誤的問題,但是如果您還有發現有破音字朗讀錯誤,可以與我們回報,我們將於下次版本修正程式與題庫。
8.2.4 隱私處理 所有的人名、地名、電話、身份證號、地址都已經置換,換成不會有同音字混淆的字,也為保護隱私,說明如下:
(1) 人名:
(2) 公司:改用A公司、B公司、統一公司、建國公司、忠孝公司、信義公司...等。 (3) 地址:A地點、B地點...或用綠島、澎湖人聽到聲音也知道的長用地名,如大同路、中正路、中山路.. 等。
|