SULJE VALIKKO

lang-FI lang-EN lang-SE

avaa valikko

Multimodal Foundation Models - From Specialists to General-Purpose Assistants
102,40 €
now publishers Inc
Sivumäärä: 230 sivua
Asu: Pehmeäkantinen kirja
Julkaisuvuosi: 2024, 06.05.2024 (lisätietoa)
Kieli: Englanti
This monograph presents a comprehensive survey of the taxonomy and evolution of multimodal foundation models that demonstrate vision and vision-language capabilities, focusing on the transition from specialist models to general-purpose assistants.

The focus encompasses five core topics, categorized into two classes; (i) a survey of well-established research areas: multimodal foundation models pre-trained for specific purposes, including two topics – methods of learning vision backbones for visual understanding and text-to-image generation; (ii) recent advances in exploratory, open research areas: multimodal foundation models that aim to play the role of general-purpose assistants, including three topics – unified vision models inspired by large language models (LLMs), end-to-end training of multimodal LLMs, and chaining multimodal tools with LLMs.

The target audience of the monograph is researchers, graduate students, and professionals in computer vision and vision-language multimodal communities who are eager to learn the basics and recent advances in multimodal foundation models.

Tuotetta lisätty
ostoskoriin kpl
Siirry koriin
LISÄÄ OSTOSKORIIN
Tuote on tilapäisesti loppunut ja sen saatavuus on epävarma.
Seuraa saatavuutta.
Multimodal Foundation Models - From Specialists to General-Purpose Assistantszoom
Näytä kaikki tuotetiedot


Toimitusehdot


Asiakaspalvelu


YHTEYSTIEDOT


SEURAA MEITÄ

Booky.fi | Kotimainen kirjakauppasi netissä

Löydä seuraava lukuelämyksesi meiltä. Valikoimassamme ovat kaikki kotimaiset kirjat sekä noin 25 miljoonaa ulkomaista teosta.
Toimitamme tilaukset maailmanlaajuisesti!



Tietosuojaseloste