Mengenal Teknologi ICR dan IDP

Apa Itu ICR

ICR adalah singkatan Intelligent Character Recognition, yaitu sistem ”cerdas” yang mampu mengenali tulisan tangan dan menterjemahkannya kedalam kode atau simbol digital yang ”dimengerti” (diedit, disimpan) oleh komputer. Sebuah piranti lunak ICR pada prinsipnya terdiri dari 4 bagian: preprocessing, character segmentation, character recognition dan post processing, sebagaimana ditampilkan pada Gambar 1 [1].

Gambar 1 Alur proses dalam sebuah sistem ICR

  1. Preprocessing
    Bagian pertama mengimplementasikan berbagai teknik dalam pengolahan citra untuk meningkatkan kualitas gambar agar mudah diolah oleh tahap berikutnya. Proses itu antara lain thresholding, konversi gray-scale ke binary black-white, noise removal, dsb.
  2. Character segmentation
    Bagian ini bertugas menganalisa sebuah citra text hasil scanning, menemukan lokasi text dan mengekstrak huruf per huruf untuk diolah pada tahap character recognition.
  3. Character recognition
    Bagian ini terdiri dari feature extraction dan classification. Feature extraction bertugas menemukan informasi signifikan dari citra sebuah huruf dan merepresentasikannya dalam vektor fitur (feature vector). Vektor ini kemudian diolah oleh classifier untuk menentukan kategori (jenis huruf). Berbagai metode classifier telah dikembangkan dalam bidang pengenalan pola (pattern recognition) sejak puluhan tahun yang lalu. Antara lain artificial neural network (jaringan saraf tiruan), support vector machine (SVM), maupun metode statistika yang lain.
  4. Post processing
    Bagian terakhir melakukan evaluasi terakhir untuk melakukan koreksi otomatis sekiranya terjadi kesalahan dalam pengenalan huruf yang dilakukan pada tahap 3.

Dari sisi teknologi, sebenarnya ICR bukanlah hal yang baru. Riset mengenai character recognition telah berpuluh tahun digali di dunia komputasi, khususnya pattern recognition (pengenalan pola) dan image processing (pengolahan citra). Bagi peneliti pattern recognition, masalah character recognition seolah menjadi masalah klasik untuk mencoba berbagai metode feature extraction maupun classifier yang mereka kembangkan. Teknologi ini dapat dikatakan telah mencapai maturity, dimana umumnya penelitian telah dapat menekan rasio error hingga kurang dari 1% (akurasi 99%) [3][4]. Di sisi industri, teknologi ICR telah diimplementasikan dalam berbagai produk komersial. Misalnya untuk membaca alamat pos yang diimplementasikan di United States Postal Service (USPS) [5], Bank check recognition [6], dan facsimile produksi Sanyo yang mampu membaca tulisan tangan nomer facsimile, dan langsung men-dial secara otomatis ke tujuan [7]. Dapat dikatakan bahwa teknologi ini telah matang dan potensi aplikasinya sangat tinggi.

Kelebihan dan Kelemahan ICR

Tiap teknologi memiliki kelebihan dan kekurangan masing-masing. Kelebihan ICR terhadap berbagai metode lain dalam data entry seperti OMR (Optical Mark Recognition) misalnya, terletak pada kemampuannya
(i)mempermudah pekerjaan operator
(ii) efisiensi biaya kertas yang diperlukan
Mempermudah di sini dimaksudkan lebih mudah bagi seseorang untuk menuliskan sebuah angka dengan baik, dibandingkan mengisi form OMR dengan mencontreng atau menghitamkan sebuah pilihan dari berbagai pilihan yang tersedia, sebagaimana saat ujian nasional, UMPTN, dsb. Apalagi dengan mempertimbangkan stamina dan kondisi petugas lapangan yang mungkin dalam kondisi lelah saat mengisi formulir. Dari sisi efisiensi, biaya pengadaan kertas dapat ditekan jauh menjadi lebih murah. Pada pemilu kali ini, formulir C1-IT terdiri dari 8 lembar yang memuat isian untuk seluruh parpol. Apabila memakai formulir khusus OMR, banyaknya halaman akan sesuai dengan jumlah parpol, karena data 1 parpol memerlukan 1 halaman OMR. Misalnya jumlah parpol 38, maka diperlukan 38 halaman [8]. Namun demikian, bukan berarti ICR bebas resiko. Apabila akurasi ICR terlalu rendah, preprocessing dan segmentasinya tidak akurat, mengakibatkan beban operator untuk melakukan verifikasi menjadi berat, sehingga tidak efektif. Dapat disimpulkan bahwa dari sisi akurasi, OMR lebih menjanjikan daripada ICR, tetapi ICR lebih unggul dari sisi biaya pengadaan kertas maupun resiko error yang timbul karena kondisi psikis di lapangan.

Apakah yang harus dilakukan agar ICR bekerja optimal ?

Dari uraian di atas jelas terlihat bahwa ICR ini berada pada ujung tombak sistem TI yang digunakan. Keberhasilan tabulasi nasional sangat bergantung pada keberhasilan ICR dalam membaca data yang dituliskan pada formulir C1-IT. Mengingat pentingnya peran ICR dalam sistem TI Pemilu 2009, perangkat lunak itu harus memenuhi 4 aspek:

  1. Tepat
    yaitu sesuai dan mampu mengolah format C1-IT, sehingga terjaga interoperabilitasnya dengan sistem yang lain
  2. Akurat
    memiliki ”kecerdasan” yang tinggi, maksudnya mampu membaca dengan akurat tulisan tangan angka pada formulir C1-IT. Secara sederhana dapat diilustrasikan demikian. Sebuah ICR yang memiliki akurasi 95% akan beresiko salah baca 5 dari 100 angka, sehingga operator hanya mengoreksi 5 angka saja. Adapun ICR yang memiliki akurasi 80% berpotensi salah baca 20 dari 100 angka, sehingga operator harus mengoreksi 20 angka atau 4 kali lipat. Apabila jumlah TPS ratusan atau ribuan, upaya koreksi ini akan berlipat ganda dan akan memberatkan operator.
  3. Aman
    yaitu terjamin keamanannya secara berjenjang pada saat data dibuat, disimpan sampai penayangannya di tabulasi nasional. Karena itulah dipasang berlapis-lapis pengamanan seperti watermark dan enkripsi.
  4. Cepat
    instalasi, setting dan kemudahan antarmuka (userfriendly interface) akan membuat pekerjaan operator menjadi lebih cepat dan ringan.

Selain itu dari sisi pengguna, harus diperhatikan hal-hal sbb.

  1. Tulislah angka sebaik dan sejelas mungkin
  2. Angka harus ditulis di kotak yang ditentukan, jangan sampai melewati batas kotak
  3. Kertas jangan sampai kotor, sobek atau terlipat
  4. Jangan terbalik saat memasukkan kertas ke scanner

Standarisasi ICR

Sejak dibentuk lewat MoU BPPT-KPU pada 12 Maret 2009, tim review BPPT berupaya membuat standar ICR, agar dapat diolah oleh bagian Sistem Integration, untuk dikirim, diolah dan ditampilkan pada tabulasi nasional [9]. Standar ICR ini merupakan penjabaran teknis dari spesifikasi yang ditetapkan pada Peraturan Komisi Pemilihan Umum No. 02 tahun 2009 [1]. Setiap vendor yang ingin menjual produk ICR nya harus memenuhi kriteria standar tersebut, agar hasilnya dapat diterima dan diolah oleh sistem yang dibangun di KPU.

Referensi

  1. Peraturan Komisi Pemilihan Umum No. 02 tahun 2009, tentang Pedoman Pengadaan dan Pengelolaan Perangkat Teknologi Informasi untuk Penyelenggaraan Pemilihan Umum Tahun 2009.
  2. R. Plamondon, S.N. Srihari: “Online and Off-line Handwriting Recognition: A Comprehensive Survey”, IEEE Trans. Pattern Analysis & Machine Intelligence
  3. Yann LeCun, Corinna Cortes: The MNIST Database of handwritten digits : http://yann.lecun.com/exdb/mnist/ (diakses 19 Maret 2009)
  4. Ranzato Marc’Aurelio, Christopher Poultney, Sumit Chopra and Yann LeCun: “Efficient Learning of Sparse Representations with an Energy-Based Model”, in J. Platt et al. (Eds), Advances in Neural Information Processing Systems (NIPS 2006), MIT Press, 2006
  5. S.N. Srihari and E.J. Keubert: “Integration of Handwritten Address Interpretation Technology into the United States Postal Service Remote Computer Reader System”, Proc. of Fourth Int’l Conf. Document Analysis and Recognition, Vol.2, pp.892-896, Ulm, Germany, Aug, 1997
  6. G.Dimauro, S.Impedovo, G.Ppirlo, and A. Salzo, “A Multi-Expert Signature Verification System for Bankcheck Processing,” Int’l Journal on Pattern Recognition and Artificial Intelligence, Vol.11, No.5, pp.827-844, 1997
  7. H. Kawajiri, Y. Takatoshi, T. Junji, A.S. Nugroho and A. Iwata : Hand-written Numeric Character Recognition for Facsimile Auto-dialing by Large Scale Neural Network CombNET-II, Proc. of 4th.International Conference on Engineering Applications of NeuralNetworks, pp.40-46, June, 10-12, 1998 Gibraltar
  8. Bambang Edhi Leksono S, Hemat Dwi Nuryanto: “Laporan Kegiatan Konsultasi Sistem Informasi Pemilihan Umum November-Desember 2008”, Komisi Pemilihan Umum, Jakarta 14 Januari 2009

 

Intelligent Document Processing (IDP) adalah teknologi berbasi AI/ML yang dapat memproses dokumen dengan menggabungkan Pengenalan Karakter Optik (OCR) dan Natural Language Processing (NLP) untuk membaca dan memahami dokumen dan mengekstrak istilah atau kata tertentu.

VibiCloud dengan teknologi AWS menawarka cara yang sangat fleksibel untuk menerapkan Inteligent document processing berbasis AI/ML. Service yang digunakan diantaranya adalah :

  1. Amazon Textrack yang secara otomatis mengekstrak teks cetak, tulisan tangan, dan data dari document yang di scan. Layanan ini melampaui teknologi OCR tradisional dengan secara akurat mengekstrak formular, table, dan teks tanpa harus melakukan pekerjaan secara manual.
  2. Lalu ada Amazon Comprehend yang merupakan layanan Natural Language Processing (NLP) yang memakai ML yang dapat mengidentifikasi Bahasa dan sentiment teks, mengekstrak frasa kunci, dan dapat mengenali beberapa entitas kustom.
  3. Selain ada Amazon Textrack dan Amazon Comprehend ada juga service Amazon Augmented AI. Ketika data tersebut sensitive atau sangat penting untuk dijaga maka Amazon Augmented AI memudahkan membangun dan mengelola human review.

Intelligent Document Processing yang menggabungkan ketiga layanan AWS yang sudah dijabarkan diatas dapat memberikan cara yang andal untuk mengurangi biaya dan upaya manual seperti mencari dokumen yang dibutuhkan tanpa harus membuka file satu persatu, salah satu keunggulan nya cukup dengan mencari kata yang di butuhkan makan akan muncul kata tersebuth ada di dokumen yang mana. Semua itu akan dapat meningkatkan hasil bisnis perusahaan.

  • Share:

ARTIKEL TERKAIT

0 COMMENTS

LEAVE A COMMENT