null
US
Entrar
Registre-se gratuitamente
Registre-se
Detectamos que o JavaScript não está habilitado no teu navegador. Habilite o Javascript para o funcionamento correto do nosso site. Por favor, leia os
Termos e Condições
para mais informações.
Próximo
Copiar e Editar
Você deve estar logado para concluir esta ação!
Inscreva-se gratuitamente
8225961
Word2Vec
Descrição
Mind map - presentation about W2V
Sem etiquetas
word2vec
neuralnetwork
mikolov
computer science
Mapa Mental por
Elisa Antolli
, atualizado more than 1 year ago
Mais
Menos
Criado por
Elisa Antolli
quase 8 anos atrás
36
0
0
Resumo de Recurso
Word2Vec
RNN
semplice -> not DNN
utile per una DNN
3 layers: input, hidden, output
spazio vettoriale: similitudine matemat.
rappresentazione distribuita
rappresentazioni solo 1-to-N sono poche informative
tante dimensioni che rappresentano "features"
similitudine tra le "feature"
con le operazioni giuste posso trovare similitudine SEMANTICHE E SINTATICHE
es.: [vector(“King”) - vector(“man”) + vector(“woman”)]
cosine distance
Word Embedding
diverso dai modelli classici come "n-gram" poichè questi sono discreti
modello simile ad un "autoencoder"
codifica le parole in vettori: non si usano string (of course)
si cerca di ricostruire ciò che è dato come input
funzione per la codifica e per la decodifca: noi abbiamo solo encoding
2 approcci
Anexos:
Word Embedding approaches
Continuous Bag of Words
corpus; vocabolario; frasi; parola target; contesto.
Modello - 3 layers: Input, Hidden, Output
INPUT: contesto
OUTPUT: parola focus
Obiettivo: Massimizzare la probabilità condizionata
HIDDEN: media
"C" input, somma delle linne "1" e divisione per C
funzione di attivazione lineare
Skip-gram
Modello - 3 layers: Input, Hidden, Output
INPUT: parola focus
OUTPUT: contesto
Obiettivo: massimizzare l'average log probability - contesti >> parola
T = lunghezza sentenza (w1,w2,...,wT)
c = lunghezza max. contesto
j = indice spostamento
wt = parola centrale
Calcolo della probabilità p( wt+j | wt )
softmax
Pro: semplice
Contro: Costo comp. proporzionale alla dim. vocabolario (C)
hierarchical softmax
limita n° vettori output che sono aggiornati
rappresentazione in albero binario
Pro: invece di valutare "v" parole per vettore (C*v), valuto log(v)
negative sampling
Anexos de mídia
65d3f461-5586-4bfd-b691-22659a687b8f (image/jpg)
Quer criar seus próprios
Mapas Mentais
gratuitos
com a GoConqr?
Saiba mais
.
Semelhante
Computing Hardware - CPU and Memory
ollietablet123
SFDC App Builder 2
Parker Webb-Mitchell
Data Types
Jacob Sedore
Intake7 BIM L1
Stanley Chia
Software Processes
Nurul Aiman Abdu
Design Patterns
Erica Solum
CCNA Answers – CCNA Exam
Abdul Demir
Abstraction
Shannon Anderson-Rush
Spyware
Sam2
HTTPS explained with Carrier Pigeons
Shannon Anderson-Rush
Data Analytics
anelvr
Explore a Biblioteca