next up previous contents
Next: テキストファイルの前処理 Up: データ準備 Previous: データ準備   目次


Xpdfによるシラバスのテキスト化

実験では、岐阜工業高等専門学校のホームページに掲載されている電気情報工学科専門科目のJコースのシラバスを使用するためダウンロードした。シラバスはPDF形式なので、まずこれをTXT形式に変換する必要がある。そのためにXpdf[13]というソフトウェアを使用した。XpdfはオープンソースのPDFビューアであり、PDFファイルから画像を取り出したり、テキストファイルに変換したりするプログラムを含んでいる。今回は、Xpdfに含まれる「pdftotext」というコマンドを用いてpdfファイルをテキストファイルに変換した。

表式(4.1)に今回の実験で使用したシラバスの一覧を示す。今回は、留学生用科目の電気情報工学演習は補習的な授業であるため、省くことにした。


表 4.1: 実験対象のシラバス
\scalebox{1.0}{
\begingroup
\renewedcommand{arraystretch}{1.3}
\begin {tabula...
...理 & 5Eソフトウェア工学 \\
\hline
\end {tabular}
\endgroup
}




Deguchi Lab. 2012年3月9日