Pemeriksa ejaan

Dalam teknologi komputasi, pemeriksa ejaan adalah aplikasi yang memeriksa semua kata dalam sebuah dokumen untuk menghindari kesalahan pengejaan. Pemeriksa ejaan dapat berupa aplikasi mandiri atau sebagai bagian dari aplikasi yang lebih besar, seperti aplikasi pengolah kata, klien surel, kamus elektronik, atau mesin pencari web.

Cara kerja

Pemeriksa ejaan dasar dapat:

  • memindai kata-kata pada suatu naskah dan mengekstraknya;
  • membandingkan kata yang salah dengan memberikan pilihan kepada pengguna terhadap kata-kata yang diketahui ejaannya oleh pemeriksa ejaan tersebut. Ini mungkin hanya akan menampilkan beberapa daftar kata, atau juga mengandung beberapa informasi tambahan, seperti kata hubung serta atribut leksikal dan gramatikal.

Dalam beberapa kasus, pemeriksa ejaan memberikan saran kata yang salah; ini dikarenakan ketidakakuratan kata yang terdapat dalam program tersebut.

  • l
  • b
  • s
Pengolahan bahasa alami
Istilah umum
  • AI-komplit
  • Bag-of-words
  • n-gram
    • Bigram
    • Trigram
  • Linguistik komputasi
  • Pemahaman bahasa alami
  • Stop words
  • Text processing
Analisis teks
  • Collocation extraction
  • Concept mining
  • Coreference resolution
  • Deep linguistic processing
  • Distant reading
  • Information extraction
  • Named-entity recognition
  • Ontology learning
  • Parsing
  • Part-of-speech tagging
  • Semantic role labeling
  • Semantic similarity
  • Sentiment analysis
  • Terminology extraction
  • Text mining
  • Textual entailment
  • Truecasing
  • Word-sense disambiguation
  • Word-sense induction
Segmentasi teks
  • Compound-term processing
  • Lemmatisation
  • Lexical analysis
  • Text chunking
  • Stemming
  • Sentence segmentation
  • Word segmentation
Peringkasan otomatis
  • Multi-document summarization
  • Sentence extraction
  • Text simplification
Mesin penerjemah
  • Computer-assisted
  • Berbasis contoh
  • Berbasis aturan
  • Statistik
  • Berbasis transfer
  • Neural
Model Semantik distribusi
  • BERT
  • Document-term matrix
  • Explicit semantic analysis
  • fastText
  • GloVe
  • Language model
  • Latent semantic analysis
  • Seq2seq
  • Word embedding
  • Word2vec
Sumber bahasa,
datasets and corpora
Jenis dan
standar
  • Linguistik korpus
  • Sumber daya leksikal
  • Data Terbuka Bertautan Linguistik
  • Kamus yang dapat dibaca mesin
  • Teks paralel
  • PropBank
  • Jaringan semantik
  • Sistem Organisasi Pengetahuan Sederhana
  • Korpus ucapan
  • Korpus teks
  • Thesaurus (information retrieval)
  • Treebank
  • Ketergantungan Universal
Data
  • BabelNet
  • Bank of English
  • DBpedia
  • FrameNet
  • Google Ngram Viewer
  • UBY
  • WordNet
Identifikasi otomatis
dan pengambilan data
Model topik
  • Document classification
  • Latent Dirichlet allocation
  • Pachinko allocation
Peninjauan
dengan bantuan komputer
  • Automated essay scoring
  • Concordancer
  • Grammar checker
  • Predictive text
  • Penilaian pengucapan
  • Pemeriksa ejaan
  • Sintaks menebak
Bahasa alami
antarmuka pengguna
Related
  • Hallucination
  • Perangkat Bahasa Alami
  • spaCy