Analyzing Transformer Dynamics as Movement through Embedding Space

Singh, Sumeet S.

Publication date

November 2023

Language

English

Abstract

Transformer based language models exhibit intelligent behaviors such as understanding natural language, recognizing patterns, acquiring knowledge, reasoning, planning, reflecting and using tools. This paper explores how their underlying mechanics give rise to intelligent behaviors. Towards that end, we propose framing Transformer dynamics as movement through embedding space. Examining Transformers through this perspective reveals key insights, establishing a Theory of Transformers: 1) Intelligent behaviours map to paths in Embedding Space which, the Transformer random-walks through during inferencing. 2) LM training learns a probability distribution over all possible paths. `Intelligence' is learnt by assigning higher probabilities to paths...

Extracted data

We use cookies to provide a better user experience.

Data Protection

Analyzing Transformer Dynamics as Movement through Embedding Space

Abstract

Extracted data

Analyzing Transformer Dynamics as Movement through Embedding Space

Abstract

Extracted data

Related items

Related items