Kuidas Lstm arvutab parameetrite arvu?
Kuidas Lstm arvutab parameetrite arvu?

Video: Kuidas Lstm arvutab parameetrite arvu?

Video: Kuidas Lstm arvutab parameetrite arvu?
Video: Finance with Python! Portfolio Diversification and Risk 2024, Mai
Anonim

Niisiis, vastavalt teie väärtustele. Selle valemisse söötmisel saadakse:->(n=256, m=4096), kokku parameetrite arv on 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472. number kaaludest on 28 = 16 (ühikute_arv * ühikute_arv) korduvate ühenduste jaoks + 12 (sisendi_dim * ühikute_arv) sisendi jaoks.

Küsiti ka, kuidas te parameetrite arvu leiate?

To arvutama õpitav parameetrid siin peame lihtsalt korrutama laiuse m kujuga, kõrgusega n ja arvestama kõik sellised filtrid k. Ärge unustage iga filtri eeltingimust. Parameetrite arv CONV-kihis oleks: ((m * n)+1)*k), lisatakse 1 iga filtri eeltingimuse tõttu.

Samamoodi, mitu peidetud ühikut Lstm sisaldab? An LSTM võrku. Võrgul on viis sisendit ühikut , a peidetud kiht koosneb kahest LSTM mäluplokid ja kolm väljundit ühikut . Igal mäluplokil on neli sisendit, kuid ainult üks väljund.

Seejärel võib ka küsida, kuidas leida RNN-is parameetrite hulk?

1 vastus. Olemid W, U ja V jagavad kõik etapid RNN ja need on ainsad parameetrid joonisel kirjeldatud mudelis. Seega parameetrite arv treenimise ajal õppida = dim(W)+dim(V)+dim(U). Küsimuse andmete põhjal on see = n2+kn+nm.

Mitu kihti on Lstmil?

Üldiselt, 2 kihid on osutunud piisavaks keerukamate funktsioonide tuvastamiseks. Rohkem kihid võib olla parem, aga ka raskem treenida. Üldine rusikareegel – 1 peidetud kiht Töötage selliste lihtsate probleemidega nagu see ja kahest piisab mõistlikult keerukate funktsioonide leidmiseks.

Soovitan: