Keywords: optical character recognition,contour analisis,intercorrelation,autocorrelation,featurepreselection,longest common subsequence
Optical Character Recognition (OCR) merupakan sebuah proses pembacaan gambar scan tulisan tangan, ketik, atau cetak oleh komputer sehingga diperoleh data teks digital. Kajian tentang OCR akhir-akhir ini ditujukan untuk menghasilkan akurasi yang baik serta beban komputasi yang semakin ringan. Hal tersebut dilakukan untuk memenuhi kebutuhan penerapannya pada perangkat bergerak yang saat ini sudah banyak digunakan. Pada penelitian ini, diterapkan metode Contour Analysis dengan representasi bilangan kompleks, serta descriptor Intercorrelation dan Autocorrelation Function. Ditambahkan pula proses contour smoothing menggunakan algoritma Ramer-Douglas-Peucker. Pada proses Feature Preselection, dibandingkan antara algoritma Longest Common Subsequence dengan Euclidian distance. Observasi dilakukan dalam menentukan kombinasi nilai parameter terbaik pada sistem OCR yang dibangun. Hasil perbandingan menunjukkan bahwa LCS lebih efisien dalam menyeleksi fitur kontur daripada Euclidean distance. Selain itu, penggunaan template Arial juga diuji dengan typeface Sans-Serif lainnya. Secara umum, hasil yang diperoleh sangat memuaskan karena rata-rata akurasi terbaik untuk setiap pengujian mampu mencapai angka 100%.