Por ejemplo, un modelo multimodal podría usarse para traducir un idioma, ya que podría acceder al texto original, al audio del habla y a las imágenes del hablante. También podría usarse para generar contenido creativo, como escribir una historia o crear una canción, ya que podría acceder al texto, al código y a las imágenes.