next up previous contents
Next: テキストファイルの前処理 Up: データ準備 Previous: データ準備   目次


Xpdfによるシラバスのテキスト化

実験では、岐阜工業高等専門学校のホームページに掲載されている電気情報工学科専門科目のJコースのシラバスを使用する。シラバスはpdf形式なので、まずこれをテキスト形式に変換する必要がある。そのためにXpdf[15]というソフトウェアを使用した。Xpdfはオープンソースのpdfビューアであり、pdfファイルから画像を取り出したり、テキストファイルに変換したりするプログラムを含んでいる。今回は、Xpdfに含まれる「pdftotext」というコマンドを用いてpdfファイルをテキストファイルに変換した。

4.1に今回の実験で使用したシラバスの一覧を示す。

表 4.1: 実験対象のシラバス
\scalebox{1.0}{
\begingroup
\renewedcommand{arraystretch}{1.3}
\begin {tabula...
...理 & 5Eソフトウェア工学 \\
\hline
\end {tabular}
\endgroup
}




Deguchi Lab. 2016年3月4日