10 Sep 2014

Document / Text Summarization dan Penerapannya

By With Tidak ada komentar:

Text summarization adalah proses mengurangi dokumen teks dengan program komputer untuk menciptakan sebuah ringkasan yang mempertahankan poin yang paling penting dari dokumen asli. . Metode Ekstraksi bekerja dengan memilih bagian dari kata yang ada, frase, atau kalimat dalam teks asli untuk membentuk ringkasan.Sebaliknya, metode abstraksi membangun sebuah representasi semantik internal dan kemudian menggunakan teknik bahasa generasi alami untuk membuat ringkasan yang lebih dekat dengan meringkas secara manual . Metode The state-of-the-art abstraktif masih cukup lemah, sehingga sebagian besar penelitian telah difokuskan pada metode ekstraktif.
Suatu artikel yang memiliki ukuran yang panjang, akan mengakibatkan pembaca akan sangat kesulitan bila harus membaca dan menyerap semua informasi dari artikel tersebut. Text Summarization akan menghasilkan suatu produk teks yang tetap memiliki/ mengandung bagian-bagian yang penting dari artikel asli. Hasil pengujian menunjukkan bahwa proses summary sangat bergantung pada jenis dan struktur dari artikel. Sistem akan menghasilkan summary yang baik bila jenis artikel yang diproses adalah jenis ilmiah argumentasi. Sedangkan untuk struktur artikel, bila suatu artikel memiliki banyak paragraf dan disetiap paragraf memiliki lebih dari dua kalimat maka mendapatkan hasil summary yang baik.
Sedangkan menurut Hovy, ringkasan adalah teks yang dihasilkan dari sebuah teks atau banyak teks, yang mengandung isi informasi dari teks asli dan panjangnya tidak lebih dari setengah teks aslinya (Hovy, 2001). Penelitian mengenai peringkasan teks otomatis (automatic text summarization) dengan menggunakan berbagai macam metode dan pendekatan, diawali sejak tahun 1958 oleh Luhn. Banyak teknik yang digunakan dalam summarization ini, seperti teknik pendekatan statistika yaitu teknik word frequency (Luhn, 1958), position in text (Baxendale, 1958), cue words and heading (Edmudson, 1969), sentence position (Lin dan Hoovy, 1997). Teknik pendekatan dengannatural language analysis yaitu inverse term frequency and NLP technique (Aone, 1990), lexical chain (Mc Keown, 1997), maximal maginal relevance (Cabonell dan Goldstein, 1998).


Karakteristik Peringkasan Teks
Terdapat dua pendekatan pada peringkasan teks, yaitu ekstraksi (shallower approaches) dan abstraksi (deeper approaches). Pada teknik ekstraksi, sistem menyalin unit-unit teks yang dianggap paling penting atau paling informatif dari teks sumber menjadi ringkasan. Unit-unit teks yang disalin dapat berupa klausa utama, kalimat utama, atau paragraf utama. Sedangkan teknik abstraksi melibatkan parafrase dari teks sumber. Teknik abstraksi mengambil intisari dari teks sumber, kemudian membuat ringkasan dengan menciptakan kalimat-kalimat baru yang merepresentasikan intisari teks sumber dalam bentuk berbeda dengan kalimat-kalimat pada teks sumber. Pada umumnya, abstraksi dapat meringkas teks lebih kuat daripada ekstraksi, tetapi sistemnya lebih sulit dikembangkan karena mengaplikasikan teknologi natural language generation yang merupakan bahasan yang dikembangkan tersendiri.
Berdasarkan jumlah sumbernya, sebuah ringkasan dapat dihasilkan dari satu sumber (single-document) atau dari banyak sumber (multi-document). Peringkasan single-document masukannya berupa sebuah teks dan keluarannya berupa sebuah teks baru yang lebih singkat. Pada peringkasan multi-document, masukan adalah beberapa dokumen teks yang memiliki tema sama, biasanya sudah ada dalam satu klaster kemudian akan dihasilkan keluaran berupa sebuah teks yang lebih singkat yang merangkum informasi-informasi utama pada klaster masukan.
Suatu ringkasan dapat bersifat general, yaitu ringkasan yang berupaya mengambil sebanyak mungkin informasi penting yang mampu menggambarkankeseluruhan isi teks. Selain itu dapat juga informasi yang diambil untuk ringkasan berdasar pada querymasukan yang didefinisikan pengguna sistem. Queryoriented atau user-oriented summarization mencoba mengambil informasi yang relevan dengan query pengguna dan menampilkannya dalam bentuk ringkasan.
Berdasarkan fungsinya, sebuah ringkasan dapat memiliki sifat indicative, informative, atau evaluative. Ringkasan informativeberfungsi menyajikan informasi utama atau yang paling penting dari teks sumber. Ringkasan indicative memberikan saran untuk pembacaan lebih lanjut mengenai hal-hal tertentu dalam isi teks. Sedangkan ringkasanevaluative memberi komentar atau evaluasi terhadap informasi utama pada teks sumber.
Compression rate pada proses peringkasan akan menentukan panjang ringkasan yang dihasilkan. Biasanya diukur berdasarkan persentase dari teks sumber, misalnya ringkasan sepanjang 10%, 25%, atau 50% dari teks sumber. Selain itu dapat pula diukur berdasarkan jumlah kata, misalnya ditentukan ringkasan sepanjang 100 kata. Biasanya, panjang ringkasan tidak lebih dari setengah teks sumber. Gambar dibawah ini memperlihatkan arsitektur tingkat tinggi peringkasan teks otomatis. Masukan berupa teks dengan berbagai karakteristik dan keluaran berupa ringkasan ekstraksi maupun abstraksi.

Metode Secara Umum
Metode dalam penerapan Text Summarization ini adalah menggunakan metode TF-IDF (Terms Frequency – Inverse Document Frequency) dan Exhaustive algorithm. Metode TF-IDF berfungsi untuk menghitung bobot nilai dari setiap kalimat dan relasi antar kalimat. Sedangkan Exhaustive algorithm berfungsi untuk menghasilkan path dari setiap penelusuran titik-titik pada graph. Dan kemudian hasil path tersebut akan menjadi suatu summary.
Metode Text Summarization terdapat 3 metode secara umum yaitu :
1.      Extraction-based summarization
2.      Abstraction-based summarization
3.      Maximum entropy-based summarization

Extraction-based summarization
Dua jenis summarization sering dibahas dalam literatur adalah ekstraksi keyphrase, di mana tujuannya adalah untuk memilih kata-kata individu atau frase untuk “tag” sebuah dokumen, dan summarization dokumen, di mana tujuannya adalah untuk memilih seluruh kalimat untuk membuat ringkasan paragraf pendek.

Pada 2012, Light Filtering, salah satu metode yang digunakan untuk summarization kalimat dari dokumen yang dinilai menuju konten utamanya, menunjukkan hasil yang baik untuk menggunakan summarization pre-processing langkah sebelum ekstraksi keyphrase.

Abstraction-based summarization
Teknik ekstraksi hanya menyalin informasi yang dianggap paling penting oleh sistem untuk ringkasan (misalnya, klausa kunci, kalimat atau paragraf), sedangkan abstraksi melibatkan parafrase bagian dari dokumen sumber. Secara umum, abstraksi dapat menyingkat teks lebih kuat dari ekstraksi, tetapi program yang bisa melakukan hal ini lebih sulit untuk mengembangkan karena mereka memerlukan penggunaan teknologi natural language generation.

Sementara beberapa proses telah dilakukan dalam abstractive summarization (menciptakan sinopsis abstrak secara manual), sebagian besar sistem summarization adalah ekstraktif (memilih subset dari kalimat untuk menempatkan dalam ringkasan).

Maximum entropy-based summarization
Meskipun automating abstractive summarization adalah tujuan dari penelitian summarization, sistem yang paling praktis didasarkan pada beberapa bentuk adalah summarization ekstraktif. Maximum entropy-based summarization telah berhasil diterapkan untuk summarization dalam domain siaran berita.

Metode Text Summarization

1. Ranked Positional Weight
            Lokasi tertentu pada teks seperti heading, judul, dan paragraf pertama cenderung mengandung informasi penting. Metode sederhana dengan mengambil paragraf pertama (lead) sebagai ringkasan biasanya cukup bagus terutama pada artikel berita. Ranked Positional Weight adalah metode yang  diusulkan oleh Helgeson dan Birnie sebagai  pendekatan untuk memecahkan permasalahan pada  keseimbangan lini dan menemukan solusi dengan cepat. Konsep dari metode ini adalah menentukan jumlah stasiun kerja minimal dan melakukan pembagian  task ke dalam stasiun kerja dengan cara memberikan bobot posisi kepada setiap task sehingga semua  task telah ditempatkan kepada sebuah stasiun kerja. Bobot setiap task, misal task ke-i dihitung sebagai waktu yang dibutuhkan untuk melakukan  task ke-i ditambah dengan waktu untuk mengeksekusi semua  task yang akan dijalankan setelah task ke-i tersebut. Urutan langkah-langkah pada metode  Ranked Positional Weight adalah sebagai berikut:
1.      Lakukan penghitungan bobot posisi untuk setiap task. Bobot posisi setiap task dihitung dari bobot suatu  task ditambah dengan bobot  task-tasksetelahnya. 
2.      Lakukan pengurutan task-task berdasarkan bobot posisi, yaitu dari bobot posisi besar ke bobot posisi kecil. 
3.      Tempatkan task dengan bobot terbesar ke sebuah stasiun kerja sepanjang tidak melanggar precedence constraint dan waktu stasiun kerja tidak melebihi waktu siklus.
4.      Lakukan langkah 3 hingga semua  task telah ditempatkan kepada suatu stasiun kerja. 

2. Cue phrase indicator criteria
            Pada beberapa genre teks, kata dan frasa tertentu dalam kalimat secara eksplisit menunjukkan seberapa penting kalimat tersebut. Daftar cue phrase beserta (positif dan negatif) ‘goodness score’ biasanya dibangun manual.

3. Word and phrase frequency criteria
            Secara umum feature yang digunakan untuk mewakili dokumen dalam model raung vector adalah kata. Hal ini karena ekstraksi kata dari dokumen relatif mudah, yaitu hanya mendeteksi deretan karakter yang diakhiri dengan spasi. Jika dirancang bahwa angka tidak merupakan bagian dari kata maka dalam bahasa Indonesia karakter khusus yang mewakili kata hanya tanda hypen (“-“), yang menunjukkan kata ulang, selainnya adalah karakter abjad. Penelitian untuk teks bahasa inggris yang melibatkan frasa menunjukkan bahwa melibatkan frasa dalam feature dapat meningkatkna kinerja clustering. Penelitian tentang deteksi dan ekstraksi frasa dalam bahasa Inggris juga telah cukup banyak dilakukan. Metode seleksi beragam mulai dengan pendekatan statistik sampai pendekatan natural language processing (NLP).
Untuk kasus bahasa Indonesia penelitian di bidang ini masih sangat minim. Dengan latar belakang itu dalam penelitian ini frasa didefinisikan sebagai dua kata yang saling berdekatan yang memiliki makna tertentu yang bisa berbeda dengan makna kata-kata tunggalnya, misalnya “kambing hitam”. Teknik ekstraksi kata ditempuh dengan cara sederhana yaitu melakukan penghitungan frekuensi kemunculan dari pasangan dua kata. Selanjutnya seperti pada kata setelah dibatasi frekuensi minimal kemunculan, analisis variansi frekuensi dilakukan untuk melakukan seleksi. sebagai persamaan berikut:


http://4.bp.blogspot.com/-a_ksixsT0bc/UMdeEU60qfI/AAAAAAAAArk/vEZRac8_4CI/s1600/Word+and+phrase+frequency+criteria.jpg
dengan qi adalah variansi jika frekuensi minimal kata/frasa muncul dalam analisis adalah I (i=0,1,2,...).
            Luhn memakai distribusi kata Zipf’s law untuk mengembangkan kriteria ekstraksi: jika sebuah teks mengandung beberapa kata yang biasanya jarang muncul, maka kalimatkalimat yang mengandung kata-kata tersebut mungkin penting.

4. Query and title overlap criteria
            Metoda sederhana tapi berguna adalah dengan memberi skor pada kalimat-kalimat sesuai jumlah kata-kata yang juga muncul pada judul, heading, atau query.

5. Cohesive or lexical connectedness criteria
            Kohesi leksikal, yaitu efek kohesif yang dicapai melalui pemilihan kosakata. Kedua, berdasarkan asal hubungannya, kohesi diklasifikasi lebih jauh berdasarkan tiga hal, yaitu.
1.      Keterkaitan bentuk yang meliputi substitusi, elipsis, dan kolokasi leksikal;
2.      Keterkaitan referensi yang meliputi referensi dan reiterasi leksikal;
3.      Hubungan semantik yang diperantai oleh konjungsi.
       Menurut Untung Yuwono dalam bukunya yang berjudul Pesona Bahasa menyatakan bahwa kohesi tidak datang dengan sendirinya, tetapi diciptakan secara formal oleh alat bahasa yang disebut pemarkah kohesi, misalnya kata ganti, kata tunjuk, kata sambung, dan kata yang diulang. Pemarkah kohesi yang digunakan secara tepat menghasilkan kohesi leksikal dan kohesi gramatikal. Kohesi leksikal adalah hubungan semantis antarunsur pembentuk wacana dengan memanfaatkan unsur leksikal atau kata yang dapat diwujudkan dengan reiterasi dan kolokasi. Reiterasi adalah pengulangan kata-kata pada kalimat berikutnya untuk memberikan penekanan bahwa kata-kata tersebut merupakan fokus pembicaraan. Reiterasi dapat berupa repetisi, sinonimi, hiponimi, metonimi, dan antonimi. Sedangkan kolokasi adalah hubungan antarkata yang berada pada lingkungan atau bidang yang sama. Contohnya, [petani] di Lampung terancam gagal memanen [padi]. [sawah] yang mereka garap terendam banjir selama dua hari. Sedangkan kohesi gramatikal adalah hubungan semantis antarunsur yang dimarkahi alat gramatikal, yaitu alat bahasa yang digunakan dalam kaitannya dengan tata bahasa. Kohesi gramatikal dapat berwujud referensi, substitusi, elipsis, dan konjungsi.
            Kata-kata dapat dihubungkan dengan berbagai cara, meliputi repetisi, coreference, sinonim, dan asosiasi semantik pada thesauri. Kalimat dan paragraf dapat diberi skor berdasarkan derajat keterhubungan kata-katanya; semakin terkoneksi diasumsikan semakin penting.

6. Discourse structure criteria
            Pembuatan struktur discourse teks dan memberi skor kalimat berdasarkan wacana sentralitas.

7. Peringkasan Teks Otomatis Berbasis Graf
            Metode berbasis graf tergolong baru dalam peringkasan teks otomatis. Metode ini memodelkan teks ke dalam bentuk graf dengan menjadikan unit-unit teks sebagai vertex dan menambahkan edges pada graf berdasarkan hubungan bermakna antar unit teks yang dijadikan vertex, kemudian menentukan tingkat pentingnya setiap vertex berdasarkan struktur graf keseluruhan.
            Konsep perankingan halaman web dengan pagerank yang telah dijelaskan akan diterapkan terhadap graf pada domain lain, yaitu graf tekstual. Graf tekstual adalah graf yang dibangun dari teks. Serupa dengan tujuan PageRank untuk melakukan perankingan halaman-halaman web, penerapan perankingan graf tekstual adalah untuk melakukan perankingan terhadap unit-unit teks. Dari hasil perankingan dapat dipilih unit-unit teks paling penting yang akan menjadi penyusun ringkasan ekstraktif.
Pada perankingan graf tekstual, teks direpresentasikan menjadi sebuah graf. Vertex/node pada graf tekstual adalah unit teks yang akan diranking, yaitu dapat berupa kata-kata, kalimat-kalimat, atau paragraf-paragraf dalam teks. Edge/link dalam grafmenunjukkan keterhubungan yang bermakna antar vertex/node. Keterhubungan tersebut dapat berupa similarity antar kalimat ataupun hubungan leksikal atau gramatikal antar kata/frasa.
Pemilihan jenis unit teks untuk dijadikan vertex bergantung pada tujuan aplikasi yang akan dicapai. Misalnya untuk ekstraksikeyphrase biasanya frasa atau kata-kata menjadivertex, sedangkan untuk ringkasan ekstraktif biasanya kalimat ataupun paragraf dipilih sebagai vertex.
Edge yang menghubungkan vertex juga disesuaikan dengan kebutuhan dan unit teks yang dipilih. Similarity biasanya digunakan untuk menyatakan hubungan suatu vertex denganvertex lain, atau dengan kata lain, antara kalimat/paragraf satu dengan kalimat/paragraf lain. Jenis similarity yang diterapkan juga beragam dan dapat didefinisikan sendiri, sesuai kebutuhan sistem peringkas yang akan dibangun, di antaranya cosine similarity dan simple word overlap.

8. Term Frequency-Inverse Document Frequency
            Metode Term Frequency-Inverse Document Frequency (TF-IDF) adalah cara pemberian bobot hubungan suatu kata ( term) terhadap dokumen. Untuk dokumen tunggal tiap kalimat dianggap sebagai dokumen. Metode ini menggabungkan dua konsep untuk perhitungan bobot, yaitu Term frequency (TF) merupakan frekuensi kemunculan kata (t) pada kalimat (d). Document frequency (DF) adalah banyaknya klaimat dimana suatu kata (t) muncul. Frekuensi kemunculan kata di dalam dokumen yang diberikan menunjukkan seberapa penting kata itu di dalam dokumen tersebut. Frekuensi dokumen yang mengandung kata tersebut menunjukkan seberapa umum kata tersebut. Bobot kata semakin besar jika sering muncul dalam suatu dokumen dan semakin kecil jika muncul dalam banyak dokumen (Robertson, 2005). Pada Metode ini pembobotan kata dalam sebuah dokumen dilakukan dengan mengalikan nilai TF dan IDF. Pembobotan diperoleh berdasarkan jumlah kemunculan term dalam kalimat (TF) dan jumlah kemunculan term pada seluruh kalimat dalam dokumen ( IDF). Bobot suatu istilah semakin besar jika istilah tersebut sering muncul dalam suatu dokumen dan semakin kecil jika istilah tersebut muncul dalam banyak dokumen ( Grossman, 1998) . Nilai IDF sebuah term dihitung menggunakan persamaan di bawah:
http://2.bp.blogspot.com/-UTMHVA2Tlk4/UMdekQJMZWI/AAAAAAAAArs/Atw8mVX88AY/s1600/menghitung+w+pada+tf-idf.jpg
Menghitung bobot (W) masing-masing dokumen dengan persamaan di bawah:
http://4.bp.blogspot.com/-6G-9Og480to/UMdelJLTw_I/AAAAAAAAAr0/FRC_mupEiqU/s1600/persamaan+metode+tf-idf.jpg

Kemudian baru melakukan proses pengurutan (sorting) nilai kumulatif dari W untuk setiap kalimat. Tiga kalimat dengan nilai W terbesar dijadikan sebagai hasil dari ringkasan atau sebagai output dari peringkasan teks otomatis.

Aplikasi
Ada berbagai jenis ringkasan tergantung pada tujuan program summarization untuk membuat ringkasan teks, misalnya generic summaries atau query relevant summaries. Sistem summarization dapat membuat kedua ringkasan teks query yang relevan dan generik mesin yang dihasilkan ringkasan tergantung pada apa kebutuhan pengguna. Summarization dokumen multimedia, misalnya gambar atau film bisa juga memungkinkan.
Beberapa sistem akan menghasilkan ringkasan didasarkan pada dokumen sumber tunggal, sementara yang lain dapat menggunakan dokumen beberapa sumber (misalnya, sekelompok berita pada topik yang sama). Terdapat sepotong teks, seperti artikel jurnal, dan terdapat hasilk daftar kata kunci atau Frase unik yang menangkap topik utama yang dibahas dalam teks. Sebaliknya, sistem keyphrase abstraktif akan menginternalisasi konten dan menghasilkan Frase unik yang mungkin lebih deskriptif dan lebih seperti apa yang manusia akan menghasilkan, seperti “kelalaian politik” atau “perlindungan yang memadai dari banjir”. Perhatikan bahwa istilah-istilah ini tidak muncul dalam teks dan memerlukan pemahaman yang mendalam, yang membuatnya sulit bagi komputer untuk menghasilkan Frase unik tersebut. Pertandingan antara Frase unik yang diusulkan dan Frase unik yang dikenal dapat diperiksa setelah berasal atau menerapkan beberapa normalisasi teks lain.

Unsupervised keyphrase extraction: TextRank
Sementara supervised methods memiliki beberapa kelebihan, seperti mampu menghasilkan aturan ditafsirkan untuk apa fitur ciri keyphrase, namun juga memerlukan sejumlah besar pelatihan data. Alih-alih mencoba untuk mempelajari fitur eksplisit yang menjadi ciri Frase unik, algoritma TextRank memanfaatkan struktur teks itu sendiri untuk menentukan Frase unik yang muncul “pusat” untuk teks dalam cara yang sama bahwa PageRank memilih halaman Web yang penting. Setelah grafik dibangun, digunakan untuk membentuk matriks stokastik, dikombinasikan dengan faktor redaman (seperti dalam “model surfer acak”), dan peringkat atas simpul diperoleh dengan mencari yang sesuai eigenvektor ke eigenvalue 1 (yaitu, distribusi stasioner dari random walk pada grafik).

Unsupervised approaches: TextRank and LexRank
Unsupervised approach untuk summarization juga memiliki model yang sama ekstraksi unsupervised keyphrase dan mendapatkan masalah sekitar pelatihan data. Kedua metode tersebut dikembangkan oleh kelompok-kelompok yang berbeda pada saat yang sama, dan LexRank hanya terfokus pada summarization, tapi hanya bisa dengan mudah digunakan untuk ekstraksi keyphrase atau tugas NLP peringkat lainnya.

Perbedaan TextRank and LexRank
Perlu dicatat bahwa TextRank yang diterapkan untuk summarization persis seperti yang dijelaskan di sini, sementara LexRank digunakan sebagai bagian dari sistem yang lebih besar summarization yang menggabungkan skor LexRank (probabilitas stasioner) dengan fitur-fitur lain seperti posisi kalimat dan panjang menggunakan kombinasi linear dengan baik bobot yang ditentukan pengguna atau secara otomatis disetel. Dalam hal ini, beberapa dokumen pelatihan mungkin diperlukan, meskipun hasil TextRank menunjukkan fitur tambahan yang tidak mutlak diperlukan.
Perbedaan penting lainnya adalah TextRank yang digunakan untuk summarization dokumen tunggal, sementara LexRank telah diterapkan untuk multi-dokumen summarization. Namun, ketika meringkas beberapa dokumen, ada risiko yang lebih besar dari memilih kalimat duplikat atau sangat berlebihan untuk menempatkan dalam ringkasan yang sama. Untuk mengatasi masalah ini, LexRank menerapkan langkah pengolahan pasca heuristik yang membangun ringkasan dengan menambahkan kalimat dalam urutan peringkat, tetapi membuang setiap kalimat yang terlalu mirip dengan yang sudah ditempatkan dalam ringkasan.


CONTOH:


Sistem Ikhtisar Dokumen untuk Bahasa Indonesia (SIDoBI) merupakan perangkat lunak berbasis web pertama di Indonesia untuk membuat ikhtisar/ringkasan secara otomatis (automatic summarization) dokumen berbahasa Indonesia. Aplikasi ini dikembangkan oleh BPPT di dalam bahasa PHP dengan memanfaatkan Free/Open Source Software (FOSS).

Abstrak

SIDoBI bekerja dengan mengambil sumber informasi suatu dokumen, mengekstrak isinya dan kemudian menampilkan ringkasan/ikhtisarnya dalam bentuk besaran relatif persentasi ikhtisar maupun jumlah kalimat ikhtisar yang diinginkan sesuai dengan keperluan pengguna.
Perangkat lunak utama yang digunakan dalam pengembangan SIDoBI adalah MEAD, tool untuk membuat ikhtisar secara otomatis. MEAD yang berbahasa Perl dan berjalan di sistem operasi, terhubung ke aplikasi SIDoBI di server web menggunakan antarmuka MeadPHP yang dikembangkan untuk SIDoBI.
Pengembangan SIDoBI dapat dibagi menjadi tiga. Pertama adalah pengembangan kamus IDF (inverse document frequency) bahasa Indonesia yang diperlukan oleh MEAD untuk membuat ikhtisar. Dilanjutkan dengan pengembangan antarmuka MeadPHP, yang bertugas menghubungkan MEAD di sistem operasi dengan aplikasi SIDoBI di server web. Dan terakhir adalah pengembangan aplikasi SIDoBI, yang bertugas menerima masukan dokumen bahasa Indonesia melalui web, menyampaikannya kepada MEAD di sistem operasi, menerima hasil ikhtisar, dan menampilkannya kembali di web.
SIDoBI berbasis FOSS sehingga dapat dimodifikasi dan disesuaikan dengan kebutuhan pengguna. Saat ini SIDoBI dapat berjalan di atas sembarang server web yang mendukung bahasa PHP dengan sistem operasi yang mendukung bahasa Perl, termasuk IGN 2007.
Kata kunci: SIDoBI, MEAD, FOSS, IGOS Nusantara, pembuat ikhtisar otomatis, bahasa Indonesia, berbasis web, PHP, Perl

Fitur

Fungsi SIDoBI dalam sistem pembuatan ikhtisar otomatis adalah sebagai antarmuka web antara pengguna akhir dengan mesin pembuat ikhtisar MEAD. Fungsi ini dapat dikelompokkan menjadi dua bagian. Yang pertama adalah aplikasi berbasis web (SIDoBI) yang berhubungan langsung dengan pengguna akhir melalui web. Yang kedua adalah antarmuka (MeadPHP) yang bertugas menghubungkan MEAD di sistem operasi dengan aplikasi SIDoBI di server web.
    Fitur-fitur dari SIDoBI diantaranya adalah:
  1. Dapat membuat ikhtisar dokumen berbahasa Indonesia.
  2. Dapat menerima masukan melalui

9 Jul 2014

UU ITE no 11/2008

By With Tidak ada komentar:

1. UU ITE No. 11 Tahun 2008


Undang-undang Informasi dan Transaksi Elektronik adalah ketentuan yang berlaku untuk setiap orang yang melakukan perbuatan hukum sebagaimana diatur dalam Undang-Undang ini, baik yang berada di wilayah hukum Indonesia maupun di luar wilayah hukum Indonesia, yang memiliki akibat hukum di wilayah hukum Indonesia dan/atau di luar wilayah hukum Indonesia dan merugikan kepentingan Indonesia.(wikipedia.com)




Download File :
Link 1
Link 2

2. Software Article : "NetBeans"


Apa itu NetBeans?

NetBeans merupakan sebuah proyek kode terbuka yang sukses dengan pengguna yang sangat luas, komunitas yang terus tumbuh, dan memiliki hampir 100 mitra (dan terus bertambah!). Sun Microsystems mendirikan proyek kode terbuka NetBeans pada bulan Juni 2000 dan terus menjadi sponsor utama.
Saat ini terdapat dua produk : NetBeans IDE dan NetBeans Platform.
The NetBeans IDE adalah sebuah lingkungan pengembangan - sebuah kakas untuk pemrogram menulis, mengompilasi, mencari kesalahan dan menyebarkan program. Netbeans IDE ditulis dalam Java - namun dapat mendukung bahasa pemrograman lain. Terdapat banyak modul untuk memperluas Netbeans IDE. Netbeans IDE adalah sebuah produk bebas dengan tanpa batasan bagaimana digunakan.
Tersedia juga NetBeans Platform; sebuah fondasi yang modular dan dapat diperluas yang dapat digunakan sebagai perangkat lunak dasar untuk membuat aplikasi desktop yang besar. Mitra ISV menyediakan plug-in bernilai tambah yang dapat dengan mudah diintegrasikan ke dalam Platform dan dapat juga digunakan untuk membuat kakas dan solusi sendiri.
Kedua produk adalah kode terbuka (open source) dan bebas (free) untuk penggunaan komersial dan non komersial. Kode sumber tersedia untuk guna ulang dengan lisensi Common Development and Distribution License (CDDL).
Fitur-fitur pada NetBeans:


·    Smart code completion : mengusulkan nama variable dari suatu tipe, melengkapi keyword, dan mengusulkan tipe parameter dari method
·    Menggunakan code generator : dengan menggunakan fitur ini kita dapat meng-generate constructor, setter and getter method, dll.
·    Error stripe : fitur yang menandai baris yang error dengan menghiglight merah.
·    Bookmarking : fitur yang digunakan untuk menandai baris yang suatu saat hendak kita modifikasi
·    go to commands : fitur yang digunakan untuk jump ke deklarasi variable, source code atau file yang ada pada project yang sama.


Database yang didukung Netbeans
·         JDBC merupakan spesifikasi standar dari javasoft API yang memungkinkan program java untuk mengakses sistem database manajemen.
·         JDBC API terdiri dari satu set interface dan kelas yang ditulis dengan bahasa pemrogramman java.
·         ojdbc (oracle java database conectivity) adalah driver yang menghubungkan program        java dan oracle
·         mysql-connector-java adalah driver yang menghubungkan program java dan oracle
·         JDBC-ODBC
·         mySQL-server

Netbeans sebagai IDE ditujukan untuk memudahkan pemrograman Java. Pada bulan Februari 2006 para instruktur Java dari Sun Microsystem mengikuti training untuk beralih dari pemrograman Java manual (memakai editor teks dan command prompt) ke pemrograman GUI dengan Netbeans.

Netbeans berbasis visual dan event-driven. Sama seperti IDE lainnya, misal Borland Delphi dan Microsoft Visual Studio. Netbeans mencakup compiler, builder dan debugger internal. Hal ini memudahkan proses pasca perancangan program. Proses deployment atau tes dapat dilakukan dengan Netbeans J2SE, J2EE, J2ME di Netbeans.

Netbeans seperti juga konsep Java sangat fleksibel. Sepanjang library Java tersedia, maka kita dapat melakukan pemrograman untuk jenis aplikasi apapun. Kita dapat membuat aplikasi dekstop (J2SE). Pemrograman web dan enterprise (J2EE) dapat dilakukan secara visual :
·         Koneksi server database melalui JDBC dapat dilakukan dari Netbeans, baik pada saat perancangan maupun deployment program.
·         Pembuatan komponen beans.
·         Pembuatan Java Server Pages (JSP), web module (servicelocator dan servlet), web services dengan menggunakan wizard yang telah disediakan.

Netbeans juga menyertakan paket web-server Apache Jakarta Tomcat, Sun Java System Application Server, GlassFish dll. Server ini dapat diakses dari dalam Netbeans, baik padasaat perancangan maupun saat deployment aplikasi web. Untuk membuat aplikasi mobile (MIDP), MIDlet dapat dirancang dengan Netbeans. Pada Netbeans 5.5 kita perlu menginstal Netbeans Mobility Pack, tetapi untuk Netbeans min versi 6.0, aplikasi MIDP, sudah ada.
Netbeans 5.0 telah mendukung JDK 5.0, sedangkan Netbeans 5.5 telah mendukung JDK 6.0.Instal terlebih dulu min JDK 1.5. Jalankan file installer Netbeans 6.5 lalu ikuti langkah- langkah instalasi wizard.
·         Langkah pertama, perhatikan lisensi SPL (Sun Public License). Baca dengan teliti untuk memahami apa yang boleh dan apa yang tidak boleh dilakukan dalam pemakaian program ini.
·         Langkah kedua, tentukan direktori instalasi.
·         Langkah ketiga, wizard melakukan pencarian otomatis terhadap JDK yang sudah terinstal dalam komputer. Jika berhasil maka JDK akan ditampilkan beserta direktori, jika tidak ditemukan maka kita dapat menentukan direktori dari JDK secara manual.
·         Langkah keempat, wizard akan melakukan instalasi Netbeans di lokasi direktori yang ditentukan. Proses instalasi ini akan memerlukan beberapa menit.
·         Proses instalasi akan membuatkan icon dalam menu Start. Kita dapat menjalankan Netbeans melalui icon ini.

Sumber : 

3. Hardware Article : "Prosessor AMD A4-6300 APU"

Prosesor AMD A4-6300 APU merupakan salah satu model A4 Series yang saat ini ada di pasaran. Di keluarga AMD APU, A4 Series memegang peranan penting karena menyasar perangkat segmen entry level yang bersahabat dari segi harga namun tetap dengan performa yang lebih dari memadai.

AMD A4-6300 APU memiliki kecepatan yang cukup baik, seberapa cepatkah jika dibandingkan dengan perangkat sekelasnya? Nanti akan kita bahas lebih lanjut.
Spesifikasi AMD A4-6300 APU
Prosesor ini dasarnya berbasis Richland dual core di bagian dalam. Frekuensi operasi normalnya mencapai 3.7GHz yang dapat ditingkatkan menjadi 3.9GHz berkat dukungan Turbo Core 3.0.
L2 Cache yang disediakan berkapasitas 1MB,menggunakan teknologi 32nm dan mendukung 64-bit. Kartu grafis yang ditawarkan adalah model AMD Radeon HD 8370D dengan frekuensi 760MHz dan 128 shaders di mana terdapat kipas serta heatsink di dalamnya. Khusus bagian kipas dirancang agar lebih hemat energi yakni hanya 2,4 watt.
AMD Radeon HD 8370D mampu memproses data hingga 34.1GB per detik, makin tinggi angka ini maka performa yang dihantarkan makin baik. Makin lengkap dengan maksimum resolusi di2560×1600 piksel, di mana resolusi ini lazim digunakan di perangkat dengan kualitas display yang sangat baik.
Dilihat dari segi kelengkapan, prosesor ini boleh diadu, dan jika dilihat dari sisi rancangan awal maka prosesor ini lebih cocok untuk perangkat-perangkat perkantoran sebab komponen dan kemampuan prosesor lebih tepat untuk pekerjaan-pekerjaan kantoran misalnya aplikasi perkantoran, menjelahan Internet dan mengolah data. Tapi jangan salah,AMD A4-6300 APU juga handal kok digunakan sebagai teman kegiatan lain misalnyauntuk memainkan game, bahkan termasuk beberapa judul game terbaru,tentunya dengan pengaturan yang disesuaikan. Perangkat ini juga cocok digunakan untuk menikmati hiburan multimedia di manapun.
Kelebihan lainnya terletak pada konsumsi daya, dengan nilai TDP hanya 65watt, AMD A4-6300 APU mampu bekerja dengan performa apik namun dengan konsumsi daya yang relatif lebih rendah dibandingkan komponen sekelas. Ditambah dengan dukungan teknologi semacam DirectX 11,OpenGL 4.3, DirectCompute 11, OpenCL 1.2 dan Shader Model 5.0 membuat AMD A4-6300 APU kian komplit.
Fitur AMD A4-6300 APU
Sejumlah fitur-fitur canggih ditanamkan di AMD A4-6300 APU, misalnya teknologi AMD Quick Streamyang memungkinkan perangkat berbekal AMD A4-6300 APU untuk dapat menikmati video streaming tanpa gangguan. Tambahan fitur AMD Perfect Picture dengan Steady Videomenjadi daya tarik tersendiri karena mampu mengurangi guncangan dan gangguan di video hasil kreasi sendiri.
Fitur AMD Wireless Display juga dibawa khusus oleh model A4 Series, di mana dengan fitur ini perangkat dapat mengirimkan gambar ke monitor atau perangkat display lainnya secara nirkabel.
Pengujian Performa
Nah, untuk pembuktian termasuk performa AMD A4-6300 APU yuk kita coba lihat hasil pengujian melawan kompetitor di kelas yang sama.





Hasil pengujian menggunakan tiga tool pengujian menunjukkan hasil bahwa AMD A4-6300 APU memiliki performa yang jauh lebih baik ketimbang merk lain dengan harga yang relatif sama.
Misalnya dari pengujian menggunakan 3Dmark FireStrike, AMD A4-6300 APU mencatatkan hasil 26% lebih baikketimbang kompetitor. Kemudian di sektor komputasi dites menggunakan Adobe Photoshope CC Smart Sharpen, hasilnya APU AMD A4-6300 APU74% lebih cepat dibandingkan merek lainnya.
Terakhir diuji memainkan game DiRT3 dengan pengaturan level teratas dengan tampilan layar 1080p, hasilnya sangat mengejutkan. AMD A4-6300 APU mencatat performa dua kali lebih baikdibandingkan komponen pesaing lain.
Hasil ini jelas mempertegas dominasi AMD A4-6300 APU atas merek lain, khususnya dari segi harga. Tetapi dari segi performa, bukti sudah berbicara. Sekarang, keputusan ada di tangan Anda. Mau coba merek lain dengan harga sama atau AMD A4-6300 APU dengan harga sama tapi performa dua kali lipat lebih baik?
Catatan:
Tes AMD dilakukan pada sistem referensi AMD yang telah dioptimalkan. Produsen PC mungkin memiliki konfigurasi berbeda sehingga memiliki hasil yang juga berbeda. Sistem AMD terdiri dari APU AMD A4-6300 dengan memori 2 x 4 GB.
DDR3-1600, SSD 256 GB, Windows 8.1, Catalyst 13.30. Sistem Intel memakai Intel Celeron G1820 dengan grafis HD, memori 2 x 4 GB DDR3-1333, SSD 256 GB, Windows 8.1, Driver 3345. Tes menggunakan Adobe Photoshop CC SmartSharpen gambar Radius 64, 5616 x 3744, 60,2 MB, format .PSD. Sistem AMD menyelesaikan tugas dalam 61,5 detik. Sistem Intel menyelesaikan tugas dalam 106,8 detik. RID-49.

Review AMD A4-6300 (Game Far Cry 3):



Sumber:

4. Dampak TIK dalam kehidupan sehari-hari


Perkembangan TIK akhir-akhir ini terus mengelami perkembangan dan sepertinya tidak akan mengalami penurunan sampai kapanpun. Hal ini menyebabkan perubahan gaya hidup sehari-hari di berbagai kalangan masyarakat dan berbagai bidang pekerjaan. Sebagai contoh nyata adalah aplikasi teknologi informasi.Beberapa jenis aplikasi tersebut adalah :
1. Aplikasi di bidang sains
Contohnya adalah aplikasi astronomi (perbintangan).


2. Aplikasi di bidang teknik/rekayasa
Contohnya adalah pembuatan robot dengan menggunakan konsep kecerdasan buatan agar robot lebih bijak.


3. Aplikasi di bidang bisnis/ekonomi
Contohnya adalah e-business, e-marketing, e-commerce dan lain-lain.


4. Aplikasi di bidang administrasi umum
Contohnya adalah aplikasi penjualan/distribusi barang, aplikasi penggajian karyawan, aplikasi akademik sekolah dan lain-lain.


5. Aplikasi di bidang perbankan
Contohnya adalah e-banking, ATM, dan m-banking.


6. Aplikasi di bidang pendidikan

Contohnya adalah e-learning (distance learning).


7. Aplikasi di bidang pemerintahan
Contohnya adalah e-government dan aplikasi inventarisasi kekayaan milik negara (IKMN).


8. Aplikasi di bidang kesehatan/kedokteran
Contohnya adalah pemeriksaane kokar diogr af i yaitu suatu pemeriksaan non invasif untuk menegakkan diagnose penyakit jantung. Dengan menggunakan alat ini aktivitas otot-otot jantung bisa dilihat langsung dilayar monitor dan lainnya.


9. Aplikasi di bidang industri/manufaktur
Contohnya adalah simulasi komputer untuk ujicoba atas rancangan sistem baru.


10. Aplikasi di bidang transportasi
Contohnya adalah aplikasi untuk mengatur jadwal penerbangan pesawat terbang.


11. Aplikasi di bidang pertahanan keamanan
Contohnya adalah aplikasi sistem keamanan data dengan enkripsi.

Selain dampak positif di berbagai bidang di atas, adapun dampak negatif pemanfaatan TIK di berbagai bidang. Beberapa akan dijelaskan dibawah ini:


Pengaruh buruk dari Games Komputer.
Salah satu contoh pengaruh buruknya adalah dari kemungkinan anak, kemungkinan besar tanpa sepengetahuan orangtua, anak ‘mengkonsumsi’ games yang menonjolkan unsur-unsur seperti kekerasan dan agresivitas. Banyak pakar pendidikan mensinyalir bahwa games beraroma kekerasan dan agresi ini adalah pemicu munculnya perilaku-perilaku agresif dan sadistis pada diri anak.


Pengaruh buruk  lewat internet.
Mampu mengakses internet sesungguhnya merupakan suatu awal yang baik bagi pengembangan wawasan anak. Sayangnya, anak juga terancam dengan banyaknya informasi buruk yang membanjiri internet.
Melalui internetlah berbagai materi bermuatan seks, kekerasan, dan lain-lain dijajakan secara terbuka dan tanpa penghalang. Sebuah studi yang menunjukkan bahwa satu dari 12 anak di Canada sering menerima pesan yang berisi muatan seks, tawaran seks, saat tengah berselancar di internet.


Pengaruh Buruk Terlalu Sering Bermain Komputer.
Kecanduan bermain komputer ditengarai memicu anak menjadi malas menulis, menggambar atau pun melakukan aktivitas sosial.
Kecanduan bermain komputer bisa terjadi terutama karena sejak awal orangtua tidak membuat aturan bermain komputer. Seharusnya, menurut Rizal, orangtua perlu membuat kesepakatan dengan anak soal waktu bermain komputer. Misalnya, anak boleh bermain komputer sepulang sekolah setelah selesai mengerjakan PR hanya selama satu jam. Waktu yang lebih longgar dapat diberikan pada hari libur.
Pengaturan waktu ini perlu dilakukan agar anak tidak berpikir bahwa bermain komputer adalah satu-satunya kegiatan yang menarik bagi anak. Pengaturan ini perlu diperhatikan secara ketat oleh orangtua, setidaknya sampai anak berusia 12 tahun. Pada usia yang lebih besar, diharapkan anak sudah dapat lebih mampu mengatur waktu dengan baik.
* Menimbang untung ruginya mengenalkan komputer pada anak, pada akhirnya memang amat   tergantung pada kesiapan orangtua dalam mengenalkan dan mengawasi anak saat bermain     komputer.
* Selain itu juga pihak sekolah harus ikut andil dalam memberikan pengarahan terbaik agar        siswa/siswi dapat mempergunakan Teknologi Informasi dan Komunikasi ke arah yang positif.
* Pemerintah sebagai pengendali semua sistem penyedia Informasi harusnya lebih aktif dalam    mengontrol penggunaan Teknologi Informasi dan Komunikasi untuk Generasi Anak Bangsa.

Sadar atau tidak sadar Teknologi Informasi dan Komunikasi telah membawa perubahan besar terhadap Generasi Penerus Bangsa, hanya tinggal kita yang bisa atau tidak membawa perubahan itu ke arah yang positif atau negatif.

Sumber:

http://cietrainsomnisa.blogspot.com/