A diferencia de GPT-3 de OpenAI o PaLM de Google, que son modelos solo con decodificador, AlexaTM 20B es un modelo seq2seq que contiene un codificador y un decodificador que permiten un mejor rendimiento en la traducción automática (MT) y el resumen. El modelo de secuencia a secuencia es una clase especial de arquitectura de red neuronal recurrente, que generalmente se usa para resolver problemas de lenguaje complejos, incluida la traducción automática, la creación de chatbots, la respuesta a preguntas, el resumen de texto, etc.
|
etiquetas: amazon , gpt-3 , openai inteligencia artificial