null
US
Sign In
Sign Up for Free
Sign Up
We have detected that Javascript is not enabled in your browser. The dynamic nature of our site means that Javascript must be enabled to function properly. Please read our
terms and conditions
for more information.
Next up
Copy and Edit
You need to log in to complete this action!
Register for Free
8225961
Word2Vec
Description
Mind map - presentation about W2V
No tags specified
word2vec
neuralnetwork
mikolov
computer science
Mind Map by
Elisa Antolli
, updated more than 1 year ago
More
Less
Created by
Elisa Antolli
almost 8 years ago
36
0
0
Resource summary
Word2Vec
RNN
semplice -> not DNN
utile per una DNN
3 layers: input, hidden, output
spazio vettoriale: similitudine matemat.
rappresentazione distribuita
rappresentazioni solo 1-to-N sono poche informative
tante dimensioni che rappresentano "features"
similitudine tra le "feature"
con le operazioni giuste posso trovare similitudine SEMANTICHE E SINTATICHE
es.: [vector(“King”) - vector(“man”) + vector(“woman”)]
cosine distance
Word Embedding
diverso dai modelli classici come "n-gram" poichè questi sono discreti
modello simile ad un "autoencoder"
codifica le parole in vettori: non si usano string (of course)
si cerca di ricostruire ciò che è dato come input
funzione per la codifica e per la decodifca: noi abbiamo solo encoding
2 approcci
Attachments:
Word Embedding approaches
Continuous Bag of Words
corpus; vocabolario; frasi; parola target; contesto.
Modello - 3 layers: Input, Hidden, Output
INPUT: contesto
OUTPUT: parola focus
Obiettivo: Massimizzare la probabilità condizionata
HIDDEN: media
"C" input, somma delle linne "1" e divisione per C
funzione di attivazione lineare
Skip-gram
Modello - 3 layers: Input, Hidden, Output
INPUT: parola focus
OUTPUT: contesto
Obiettivo: massimizzare l'average log probability - contesti >> parola
T = lunghezza sentenza (w1,w2,...,wT)
c = lunghezza max. contesto
j = indice spostamento
wt = parola centrale
Calcolo della probabilità p( wt+j | wt )
softmax
Pro: semplice
Contro: Costo comp. proporzionale alla dim. vocabolario (C)
hierarchical softmax
limita n° vettori output che sono aggiornati
rappresentazione in albero binario
Pro: invece di valutare "v" parole per vettore (C*v), valuto log(v)
negative sampling
Media attachments
65d3f461-5586-4bfd-b691-22659a687b8f (image/jpg)
Show full summary
Hide full summary
Want to create your own
Mind Maps
for
free
with GoConqr?
Learn more
.
Similar
Computing Hardware - CPU and Memory
ollietablet123
SFDC App Builder 2
Parker Webb-Mitchell
Data Types
Jacob Sedore
Intake7 BIM L1
Stanley Chia
Software Processes
Nurul Aiman Abdu
Design Patterns
Erica Solum
CCNA Answers – CCNA Exam
Abdul Demir
Abstraction
Shannon Anderson-Rush
Spyware
Sam2
HTTPS explained with Carrier Pigeons
Shannon Anderson-Rush
Data Analytics
anelvr
Browse Library