Selanjutnya, tahap normalisasi digunakan untuk mengubah teks menjadi bentuk yang lebih standar, seperti menghapus tanda baca atau mengganti kata-kata dengan kata-kata dasar mereka (stemming).
Setelah itu, tahap penting dalam NLP adalah pemahaman bahasa alami (natural language understanding/NLU). NLU melibatkan pemahaman struktur dan makna dari teks. Ini mencakup teknik-teknik seperti analisis sintaksis untuk memahami tata bahasa, analisis semantik untuk memahami arti kata dan frasa, dan ekstraksi informasi untuk mengidentifikasi entitas seperti orang, tempat, atau tanggal.
Setelah pemahaman bahasa alami, langkah selanjutnya adalah pemrosesan bahasa alami (natural language processing/NLP). NLP melibatkan penggunaan aturan, statistik, dan pembelajaran mesin untuk memanipulasi teks.
Tahap ini mencakup tugas seperti penerjemahan otomatis, pembuatan ringkasan teks, pengenalan entitas bernama, dan banyak lagi. Metode seperti model bahasa, jaringan saraf, dan algoritma pembelajaran mesin lainnya sering digunakan dalam NLP.
Selain itu, generasi bahasa alami (natural language generation/NLG) juga merupakan bagian penting dari NLP. NLG melibatkan menghasilkan teks manusia yang alami dari data yang terstruktur atau instruksi. Contoh penggunaan NLG termasuk pembuatan laporan otomatis, penulisan berita otomatis, atau respons chatbot.