自然语言交互系统一般包括三个模块:语音识别(Automatic Speech Recognition,ASR),将语音转化成文字;自然语言处理(Natural Language Processing,NLP),将文字的含义解读出来进行处理并给出反馈;语音合成(Text To Speech,TTS),如果有需要可将输出信息转化成语音。虽然自然语言交互具有自然直接的优点,但也存在着劣势。例如:不适用于选择多、流程长、需要大量辅助信息决策的交互任务;远场自然语言交互对距离、噪声、混响、声源数量等有一系列要求;一般不适用于公共场所,通常需要安静的场所。