Tip:
Highlight text to annotate it
X
>> Lucas Freitas: Uy.
Maligayang pagdating sa lahat.
Ang pangalan ko ay Lucas Freitas.
Ako ay isang junior sa [hindi marinig] pag-aaral computer science na may pagtuon sa
computational aghamwika.
Kaya ang aking pangalawang ay sa wika at wika teorya.
Talagang ako ay nasasabik na magturo sa iyo guys Medyo tungkol sa mga patlang.
Ito ay isang napaka-kapana-panabik na lugar sa pag-aaral.
Gayundin na may maraming mga potensyal na para sa hinaharap.
Kaya, talagang ako ay nasasabik na kayo guys isinasaalang-alang ang mga proyekto sa
computational aghamwika.
At kukunin ko na maging mas kaysa masaya na payuhan anuman sa iyo kung ikaw ay magpapasiyang
ituloy ang isa sa mga iyon.
>> Kaya una sa lahat ano ang mga computational aghamwika?
Kaya computational aghamwika ay ang intersection sa pagitan ng aghamwika at
computer science.
Kaya, ano ang aghamwika?
Ano ang computer science?
Well mula aghamwika, kung ano tinitingnan namin ang mga wika.
Kaya aghamwika ay aktwal na ang pag-aaral natural na wika sa pangkalahatan.
Kaya natural na wika - makipag-usap namin tungkol sa wika na talaga naming gamitin upang
makipag-komunikasyon sa bawat isa.
Kaya hindi eksakto naming pinag-uusapan tungkol sa C o Java.
Kami ay pakikipag-usap nang higit pa tungkol sa Ingles at Chinese at iba pang mga wika na aming
gamitin upang makipag-komunikasyon sa bawat isa.
>> Ang hamon ang bagay tungkol sa na ay na ngayon kami ay may halos 7,000
mga wika sa mundo.
Kaya may mga medyo isang mataas na iba't-ibang ng mga wika na maaari naming pag-aralan.
At pagkatapos ay sa tingin mo na ito ay marahil napakahirap na gawin, halimbawa,
pagsasalin mula sa isang wika papunta sa isa, isinasaalang-alang na mayroon ka
halos 7,000 sa kanila.
Kaya, kung sa tingin mo ng paggawa ng pagsasaling-wika mula sa isang wika upang ang iba pang mga mo
mayroon nang halos mahigit sa isang milyong iba't ibang mga kumbinasyon na maaari mong
Mayroon mula sa wika sa wika.
Kaya ito talaga ang Hinahamon upang gumawa ng ilang uri ng system halimbawa ng pagsasaling-wika para sa
bawat solong wika.
>> Kaya, aghamwika Treat may syntax, semantika, pragmatics.
Ikaw guys hindi na kailangan ng eksaktong malaman kung ano ang mga ito.
Ngunit ang napaka-kagiliw-giliw na bagay ay na bilang isang katutubong nagsasalita, kapag malaman mo
wika bilang anak, na aktwal mong malaman lahat ng mga bagay - syntax semantika
at pragmatics -
sa pamamagitan ng iyong sarili.
At walang saysay na tao ay may magturo sa iyo syntax para sa sa iyo upang maunawaan kung paano pangungusap ay
nakaayos.
Kaya, ito ay talagang kawili-wiling dahil ito ay isang bagay na ay napaka
intuitively.
>> At kung ano ang mo paglalaan mula sa ang computer science?
Well, ang pinakamahalagang bagay na namin mayroon sa computer science muna ng ay
lahat, artificial intelligence at pagkatuto ng machine.
Kaya, kung ano ang sinusubukan naming ginagawa computational aghamwika ay magturo
iyong computer kung paano gawin ang isang bagay may wika.
>> Kaya, halimbawa, sa makina pagsasalin.
Sinusubukan ko upang magturo ng computer kung paano ang aking malaman kung paano i-transition mula sa isa
wika sa iba.
Kaya, gusto talaga pagtuturo isang computer ng dalawang wika.
Kung gagawin ko pagpoproseso ng natural na wika, kung saan ay ang kaso para sa halimbawa ng
Graph ng Paghahanap Facebook ni, magturo sa iyo iyong computer kung paano upang maunawaan
mga query na rin.
>> Kaya, kung sinabi mong "ang mga larawan ng aking mga mga kaibigan. "ay hindi ituturing ng Facebook na
bilang isang buo string na may lamang ng grupo ng mga salita.
Ito talaga nauunawaan ang kaugnayan sa pagitan ng "mga larawan" at "aking mga kaibigan" at
nauunawaan na "mga larawan" ay ari-*** ng "aking mga kaibigan."
>> Kaya, na bahagi ng, halimbawa, pagproseso ng natural na wika.
Ito ay sinusubukan upang maunawaan kung ano ang ay ang kaugnayan sa pagitan ng
ang mga salita sa isang pangungusap.
At ang malaking tanong ay, maaari mong magturo sa isang computer kung paano makipag-usap
isang wika sa pangkalahatan?
Alin ang isang napaka-kagiliw-giliw na tanong sa sa tingin, na parang siguro sa hinaharap,
ka pagpunta sa magagawang makipag-usap sa iyong cell phone.
Uri ng tulad ng kung ano ang aming ginagawa sa Siri ngunit isang bagay na mas katulad, maaari mo talaga
sabihin ang kahit anong gusto mo at ang telepono Pupunta upang maunawaan ang lahat.
At ito ay maaaring magkaroon ng follow up tanong at panatilihin ang pakikipag-usap.
Iyan ay isang bagay na talagang kapana-panabik, sa aking opinyon.
>> Kaya, isang bagay tungkol sa natural na wika.
Isang bagay na talagang kawili-wiling tungkol sa natural na wika ay na iyon, at ito ay
credit sa aking propesor aghamwika, Maria Polinsky.
Binibigyan niya ng halimbawa at sa tingin ko talaga kawili-wili.
Dahil kami matuto wika mula sa kapag kami ay ipinanganak at pagkatapos ay ang aming mga native
wika uri ng lumalaki sa amin.
>> At isa lamang ka matuto wika mula sa minimal na input, tama?
Lamang ka nakakakuha ng input mula sa iyong mga magulang ng kung ano ang tunog iyong wika
gusto at malaman mo lang ito.
Kaya, ito ay kawili-wili dahil kung titingnan mo sa mga pangungusap, halimbawa.
Inaasahan mo, "naglalagay Maria sa isang amerikana bawat oras siya ay umalis sa bahay. "
>> Sa kasong ito, posibleng magkaroon ng salitang "siya" sumangguni sa Maria, tama?
Maaari mong sabihin ang "Inilalagay ni Maria sa isang amerikana sa bawat oras na nag-iiwan ni Maria ang
bahay. "nang sa gayon ay pinong.
Ngunit pagkatapos ay kung tiningnan mo ang mga pangungusap "Inilalagay niya sa isang amerikana sa tuwing Mary
umalis sa bahay. "Alam mo ito imposible upang sabihin na "siya" ay
nagre-refer sa Mary.
>> Walang paraan ng pagsabi na "naglalagay Maria sa isang amerikana sa bawat oras na nag-iiwan Maria
ang bahay. "Kaya ito ay kawili-wili dahil ito ay ang uri ng intuwisyon
na ang bawat katutubong nagsasalita ay may.
At walang saysay na tao ay itinuro na ito ay ang paraan na gumagana ang syntax.
At maaari ka lamang magkaroon ito "siya" nagre-refer sa Mary sa unang kaso,
at talagang sa iba pang mga Masyadong, ngunit hindi sa isang ito.
Ngunit lahat ng tao uri ng nakakakuha sa parehong sagot.
Ang bawat tao'y ay sumang-ayon sa na.
Kaya ito ay talagang kawili-wiling kung paano bagaman hindi mo alam ang lahat ng mga panuntunan
sa iyong wika uri ng sa iyo na maunawaan kung paano gumagana ang wika.
>> Kaya ang kagiliw-giliw na bagay tungkol sa natural wika ay hindi mo na kailangang mag-
alam anumang syntax malaman kung ang isang pangungusap ay naaalinsunod sa Balarila o ungrammatical para sa
karamihan ng mga kaso.
Aling gumagawa sa tingin mo na siguro kung ano ang mangyayari ay na sa pamamagitan ng iyong buhay, mo
panatilihin lamang sa pagkuha ng higit pa at higit pa pangungusap na sinabi sa iyo.
At pagkatapos mong mapanatili ang memorizing lahat ng mga pangungusap.
At pagkatapos ay kapag may isang taong nagsasabi sa iyo isang bagay, maririnig mo na pangungusap at
kang tumingin sa iyong bokabularyo ng mga pangungusap at tingnan kung
pangungusap na doon.
At kung ito ay doon ka sabihin ito ay naaalinsunod sa Balarila.
Kung ito ay hindi sabihin mo ito ungrammatical.
>> Kaya, sa kasong iyon, nais mong sabihin, oh, kaya mayroon kang isang malaking listahan ng lahat ng
posibleng mga pangungusap.
At pagkatapos kapag naririnig mo ang isang pangungusap, mo alam kung ito ay naaalinsunod sa Balarila o
hindi batay sa na.
Bagay ay na kung tiningnan mo ang isang pangungusap, halimbawa, "Ang
limang buhok CS50 TFs luto ang bulag pugita gamit ang isang DAPA saro. "Ito ay
Talagang hindi isang pangungusap na iyong narinig bago.
Ngunit sa parehong oras na alam mo ito halos naaalinsunod sa Balarila, tama?
Walang mga naaalinsunod sa Balarila pagkakamali at maaari mong sabihin na
ito ay isang posibleng pangungusap.
>> Kaya ginagawang amin sa tingin na aktwal na ang paraan na malaman namin ang wika ay hindi lamang
sa pamamagitan ng pagkakaroon ng isang malaking database ng mga posibleng mga salita o pangungusap, pero higit pa sa
pag-unawa sa kaugnayan sa pagitan ng mga salita sa mga pangungusap.
Ba na magkaroon ng kahulugan?
Kaya, pagkatapos ay ang tanong ay, maaari mga computer matuto wika?
Puwede ba kaming turuan wika sa mga computer?
>> Kaya, sa tingin ng mga pagkakaiba ipaalam sa pagitan ng isang katutubong nagsasalita ng wika
at isang computer.
Kaya, ano ang mangyayari sa speaker?
Well, ang katutubong nagsasalita natututo ng isang wika mula sa pagkakalantad dito.
Karaniwan nitong unang bahagi ng taon ng pagkabata.
Kaya, talaga, mayroon na lamang kayong isang sanggol, at patuloy mong pakikipag-usap sa ito, at ito
lamang natututo kung paano makipag-usap ang wika, tama?
Kaya, isa lamang ka na nagbibigay sa input upang ang sanggol.
Kaya, pagkatapos ay maaari mong magtaltalan na ang isang computer Maaari gawin ang parehong bagay, tama?
Maaari mo lamang ibigay wika bilang input sa computer.
>> Bilang halimbawa ng grupo ng mga file na may mga libro sa Ingles.
Siguro iyon ang isang paraan na iyong maaaring posibleng magturo ng
computer na Ingles, tama?
At sa katunayan, kung sa tingin mo ang tungkol dito, na tumagal siguro ng ilang
araw na basahin ang isang libro.
Para sa isang computer tumatagal ng isang segundo upang tumingin sa lahat ng mga salita sa isang aklat.
Kaya maaari mong isipin na maaaring lamang ito argumento ng input mula sa paligid mo,
hindi iyon sapat upang sabihin na iyon isang bagay na magagawa lamang ng mga tao.
Maaari mong isipin na computer Maaari ring makakuha ng pag-input.
>> Ang ikalawang bagay ay na native speaker mayroon din isang utak na may
kakayahan sa pag-aaral ng wika.
Ngunit kung sa tingin mo ang tungkol dito, isang utak ay isang solid na bagay.
Kapag kayo ay ipinanganak, na-set -
ito ay ang iyong utak.
At bilang palaguin mo up, kumuha ka lang nang higit pa input ng wika at siguro nutrients
at iba pang mga bagay-bagay.
Pero halos iyong utak ay isang solid na bagay.
>> Kaya maaari mong sabihin, mahusay, marahil maaari mong bumuo ng isang computer na may isang bungkos ng
mga pag-andar at mga pamamaraan na gayahin lamang kakayahan sa pag-aaral ng wika.
Kaya sa na kahulugan, maaari mong sabihin, mahusay, ako ay maaaring magkaroon ng isang computer na mayroon ng lahat ng
mga bagay na kailangan kong malaman wika.
At ang huling bagay ay na ang isang katutubong speaker natututo mula sa pagsubok at error.
Kaya isa lamang ng isa pang mahalagang bagay sa pag-aaral ng wika ay na uri
ng matuto ng mga bagay sa pamamagitan ng paggawa generalizations ng kung ano ang iyong naririnig.
>> Kaya bilang mo ay lumalaki ng hanggang malaman mo na ang ilang mga salita ay mas katulad nouns,
ilang iba pang alin ang adjectives.
At hindi mo na kailangang magkaroon ng anumang kaalaman ng aghamwika
na maunawaan na.
Pero alam mo lamang mayroong ilang mga salita ay nakaposisyon sa ilang bahagi ng
pangungusap at ilang iba sa iba pang mga mga bahagi ng pangungusap.
>> At na kapag gumawa ka ng isang bagay na tulad ng isang pangungusap na hindi tama -
siguro dahil sa isang higit sa kalahatan halimbawa.
Siguro kapag tapos ka na lumalagong up, napansin mo na ang maramihan ay karaniwang
nabuo sa pamamagitan ng paglalagay ng isang S sa sa dulo ng salita.
At pagkatapos ay subukan mong gawin ang pangmaramihang ng "Usa" bilang "deers" o "ngipin" bilang
"Tooths." Kaya pagkatapos ay sa iyong mga magulang o isang tao corrects mo at sabi, walang, ang
plural ng "usa" ay "usa," at ang plural ng "ngipin" ay "ngipin." At pagkatapos ay
mong malaman ang mga bagay-bagay.
Kaya matuto ka mula sa pagsubok at error.
>> Ngunit maaari mo ring gawin iyon may isang computer.
Maaari kang magkaroon ng isang bagay na tinatawag na dagdag na mga kagamitan sa pag-aaral.
Aling ay isa lamang tulad ng ibinigay na isang computer ng isang gantimpala sa tuwing ginagawa nito
isang bagay nang tama.
At pagbibigay ito ng kabaligtaran ng isang gantimpala at kapag ginagawa nito ng isang bagay na mali.
Maaari mong aktwal na makita na kung pumunta ka sa Google Translate at mong subukan ang upang
isalin ang isang pangungusap, ito humihiling sa iyo para sa puna.
Kaya kung sabihin mo, oh, mayroong isang mas mahusay na translation para sa pangungusap na ito.
Maaari mo itong i-type up at pagkatapos ay kung ng maraming mga tao panatilihin na nagsasabi na ang isang mas mahusay na
pagsasalin, lamang nalalaman nito na ito dapat gumamit ng pagsasaling-wika na sa halip ng
ang isa ito ay nagbibigay sa.
>> Kaya, ito ay isang napaka pilosopiko tanong upang makita kung ang mga computer ay pagpunta sa maging
makakapag-usap o hindi sa hinaharap.
Ngunit Mayroon akong mataas na pag-asa na maaari nilang lamang batay sa mga argumento.
Ngunit ito ay higit pa lamang ng isang pilosopiko tanong.
>> Kaya habang computer pa rin ay hindi maaaring makipag-usap, ano ang mga bagay na maaari naming gawin?
Ang ilang mga talagang cool na bagay ang pag-uuri ng data.
Kaya, halimbawa, alam mo guys na mga serbisyo sa email gawin, para sa
Halimbawa, pag-filter ng spam.
Kaya sa tuwing makakatanggap ka ng spam, ito Sinusubukan upang i-filter sa isa pang box.
Kaya paano nito gawin iyon?
Hindi ito gusto lang alam ang computer anong email address ay pagpapadala ng spam.
Kaya ito ay higit batay sa nilalaman ng ang mensahe, o marahil ang pamagat, o
siguro ilang mga pattern na mayroon ka.
>> Kaya, talaga, kung ano ang maaari mong gawin ay ang makakuha ng isang maraming data ng mga email na spam,
mga email na hindi spam, at alamin kung ano ang uri ng mga pattern na mayroon ka sa
mga bago na spam.
At ito ay bahagi ng computational aghamwika.
Ito ay tinatawag na pag-uuri ng data.
At talagang kami ay pagpunta upang makita ang isang halimbawa ng na sa susunod na mga slide.
>> Ang ikalawang bagay ay ang natural na wika processing kung saan ay ang bagay na ang
Graph ng Paghahanap ay ang paggawa ng pagpapaalam sumulat ka ng isang pangungusap.
At ito trusts sa iyo na maunawaan kung ano ang ay ang kahulugan at nagbibigay sa
sa iyo ng mas mahusay na resulta.
Talaga, kung pumunta ka sa Google o Bing at maghanap ka ng isang bagay tulad ng Lady
Taas mangha, ang aktwal na pagpunta upang makakuha ng 5 '1 "sa halip na impormasyon
mula sa kanya dahil talaga ito naiintindihan kung ano ang pinag-uusapan mo tungkol sa.
Kaya na ay bahagi ng likas na pagproseso ng wika.
>> O kaya naman din kapag gumagamit ka ng Siri, una mayroon kang isang algorithm na sumusubok na
isalin kung ano ang sinasabi mo sa salita, sa teksto.
At pagkatapos nito sinusubukang i-translate na sa kahulugan.
Kaya na ang lahat ng mga bahagi ng natural pagproseso ng wika.
>> Pagkatapos ay mayroon kang pagsasalin ng computer -
na kung saan ay talagang isa ng aking mga paborito -
na kung saan ay isinasalin lamang mula sa isang wika patungo sa isa pa.
Kaya maaari mong isipin na kapag ikaw ay gumagawa ng pagsasalin ng computer, mayroon kang
walang katapusan na posibilidad ng mga pangungusap.
Kaya walang paraan ng pag-iimbak lamang bawat solong pagsasalin.
Kaya mayroon kang makabuo ng mga kawili-wiling algorithm upang ma-
isalin bawat solong pangungusap sa ilang mga paraan.
>> Ikaw guys may mga katanungan sa ngayon?
Walang?
OK.
>> Kaya kung ano ang aming makikita ngayon?
Una sa lahat, ako ng pagpunta sa makipag-usap tungkol sa ang problema pag-uuri.
Kaya ang isa na ako ay sinasabi tungkol sa spam.
Ano pupuntahan ko lang gawin ay, na ibinigay lyrics sa isang kanta, maaari mong subukan upang malaman kung
may mataas na posibilidad sino ay ang mang-aawit?
Sabihin natin na mayroon akong mga kanta mula sa Lady Mangha at Katy Perry, kung bibigyan ko kayo ng isang
bagong kanta, maaari mong malaman kung ito ay Katy Perry o Lady mangha?
>> Ang ikalawang isa, tingin lang ako sa pagpunta sa makipag-usap tungkol sa problema sa pagse-segment.
Kaya hindi ko alam kung ka guys alam, ngunit Chinese, Japanese, iba pang mga East Asian
wika, at iba pang mga wika sa pangkalahatan, walang
puwang sa pagitan ng mga salita.
At pagkatapos ay kung sa tingin mo tungkol sa ang paraan na iyong computer uri ng pagsusubok sa
Nauunawaan natural na pagpoproseso ng wika, tinitingnan nito ang mga salita at
Sinusubukan upang maunawaan ang mga pakikipag-ugnayan sa pagitan ng mga ito, i-right?
Ngunit pagkatapos ay kung mayroon kang Chinese, at mo may zero na mga puwang, ito ay talagang mahirap na
malaman kung ano ang kaugnayan sa pagitan ng salita, sapagkat sila ay walang anumang
mga salita sa unang.
Kaya kailangan mong gawin ang isang bagay na tinatawag na segmentation na lamang ay nangangahulugan na ang paglalagay ng
puwang sa pagitan ng kung ano ang nais naming tawagan mga salita sa mga wikang iyon.
Magkaroon ng kahulugan?
>> At pagkatapos ay kami ay pagpunta sa makipag-usap tungkol sa syntax.
Kaya lang nang kaunti tungkol sa natural pagproseso ng wika.
Ito ay pagpunta sa maging lamang ng isang pangkalahatang-ideya.
Kaya ngayon, isa lamang sa kung ano ang gusto kong gawin ay magbibigay sa iyo ng guys ng kaunting isang
sa loob ng ano ang mga posibilidad na maaari mong gawin sa computational
aghamwika.
At pagkatapos ay makikita mo kung ano sa tingin mo ay cool na kasama ng mga bagay.
At marahil maaari mong isipin ang isang proyekto at dumating makipag-usap sa akin.
At maaari kong bigyan ka ng payo sa kung paano ipatupad ito.
>> Kaya syntax ay magiging kaunti tungkol sa Paghahanap ng graph at mga machine
pagsasalin.
Lamang ako ng pagpunta sa bigyan ang isang halimbawa kung paano maaari mong, halimbawa, isalin
isang bagay mula sa Portuges sa Ingles.
Magaling?
>> Kaya una, ang problema pag-uuri.
Sasabihin kong ang bahaging ito ng pantas-aral ay magiging ang pinaka-mapaghamong
isa dahil lamang doon ang nangyayari sa ilang mga coding.
Ngunit ito ay pagpunta sa maging Python.
Alam ko ka guys ay hindi alam Python, kaya Lamang ako ng pagpunta sa ipaliwanag sa mga matataas
antas kung ano ako ng paggawa.
At wala kang masyadong upang talagang pakialam magkano ang tungkol sa syntax dahil na
isang bagay na maaaring matutunan mo guys.
OK?
Magaling.
>> Kaya kung ano ay ang problema pag-uuri?
Kaya binibigyan ka ng ilang lyrics sa ng kanta, at gusto mong hulaan
sino ang kumanta nito.
At ito ay maaaring maging para sa anumang uri ng iba pang mga problema.
Kaya ito ay maaaring, halimbawa, mayroon kang isang pampanguluhan kampanya at mayroon kang isang
pananalita, at nais mong hanapin kung ito ay, halimbawa,
Obama o glab sa beisbol Romney.
O maaari kang magkaroon ng grupo ng mga e-mail at gusto mong malaman kung ang mga ito
spam o hindi.
Kaya ito ay lamang ng ilang mga pag-uuri data batay sa mga salita
na mayroon ka doon.
>> Kaya upang gawin iyon, kailangan mong gumawa ng ilang mga pagpapalagay.
Kaya marami tungkol sa computational aghamwika ay gumagawa pagpapalagay,
karaniwan na smart pagpapalagay, upang maaari kang makakuha ng mahusay na mga resulta.
Sinusubukang upang lumikha ng isang modelo para dito.
At pagkatapos ay subukan ito at makita kung ito gumagana, kung binibigyan ka nito mahusay na katumpakan.
At kung ginagawa nito, pagkatapos ay i-mo subukan upang mapagbuti ito.
Kung hindi ito, ikaw ay tulad, OK, siguro ako dapat na gumawa ng ibang palagay.
>> Kaya ang palagay na kami ay pagpunta sa gumawa ay ang isang artist karaniwang SINGS
tungkol sa isang paksa nang maraming beses, at siguro ay gumagamit ng mga salita maraming beses lamang
dahil ang mga ito ay ginagamit upang ito.
Maaari mong isipin lang sa iyong mga kaibigan.
Ako ba mo guys sa lahat ng may mga kaibigang na sabihin ang kanilang mga parirala na lagda,
Literal na para sa bawat solong pangungusap -
tulad ng ilang mga tukoy na salita o ilang mga tukoy na parirala na sinasabi nila para sa
bawat solong pangungusap.
>> At kung ano ang maaari mong sabihin ay kung makita mo isang pangungusap na may lagda
parirala, maaari mong hulaan na marahil ang iyong mga kaibigan ay ang
isa na sinasabi ito, tama?
Kaya gumawa ka na pagkukunwari at pagkatapos ay na kung paano ka lumikha ng isang modelo.
>> Ang halimbawa na pupuntahan ko bigyan ay sa paano Lady mangha, halimbawa, mga tao
sabihin na gumagamit siya ng "sanggol" para sa lahat ng kanyang mga numero ng isa kanta.
At talagang ito ay isang video na palabas ang kanyang sinasabi ang salitang "sanggol" para sa
iba't ibang kanta.
>> [VIDEO sa pag-playback]
>> - (Awit) Baby.
Baby.
Baby.
Baby.
Baby.
Babe.
Baby.
Baby.
Baby.
Baby.
>> [END VIDEO sa pag-playback-
>> Lucas Freitas: Kaya may mga, sa palagay ko, 40 kanta dito kung saan sabi niya ang
salitang "sanggol." Kaya maaari mong talaga hulaan na kung makakita ka ng isang kanta na may
ang salitang "sanggol," mayroong ilang mga mataas posibilidad na ito ay Lady mangha.
Ngunit Subukan upang bumuo ito ipaalam karagdagang higit pa pormal.
>> Kaya ito ay mga lyrics sa kanta ni Lady mangha at Katy Perry.
Kaya tumingin ka sa Lady mangha, makikita mo sila magkaroon ng maraming mga pagkakaroon ng "sanggol," isang
maraming pangyayari ng "paraan." At pagkatapos ay Katy Perry ay may napakaraming mga pangyayari ng
"Ang," ng maraming mga pagkakaroon ng "apoy."
>> Kaya talaga kung ano ang gusto naming gawin ay, kumuha ka ng isang tula ng damdamin.
Sabihin natin na kumuha ka ng isang tula ng damdamin para sa isang kanta na ay "sanggol," "sanggol." lamang Kung
mong makuha ang salitang "sanggol," at ito ay ang lahat ng mga data na mayroon ka mula sa
Lady mangha at Katy Perry, na gagawin ikaw hulaan ay ang tao
sino SINGS ang kanta?
Lady mangha o Katy Perry?
Lady mangha, tama?
Dahil siya ang isa lamang na nag-sabi "Sanggol." Ito tunog estupido, tama?
OK, ito ay talagang madali.
Lamang Naghahanap ako sa dalawang kanta at ng Siyempre, siya ang isa lamang kung sino ang may
"Sanggol."
>> Ngunit ano kung mayroon kang isang bungkos ng mga salita?
Kung mayroon kang isang aktwal na tula ng damdamin, isang bagay tulad ng, "sanggol, ako lamang
nagpunta upang makita ang isang [? CFT?]
magbigay ng panayam, "o isang bagay tulad na, at pagkatapos mo talagang may upang malaman kung -
batay sa lahat ng mga salitang iyon -
sino ang artist na marahil kumanta ang kantang ito?
Kaya Subukan upang bumuo ipaalam ito ng kaunti pa.
>> OK, kaya batay lamang sa data na namin Nakakuha, tila na mangha ay marahil
ang mang-aawit.
Ngunit kung paano maaari naming magsulat ito ang nalalaman pormal?
At doon pupuntahan maging ng kaunti bit ng istatistika.
Kaya kung mawala, subukan lamang upang maunawaan ang mga konsepto.
Hindi mahalaga kung nauunawaan mo ang mga equation perpektong na rin.
Ito ay lahat ng pagpunta sa maging online.
>> Kaya talaga kung ano ako sa pagkalkula ay ang posibilidad na mangyari na ang kantang ito ay sa pamamagitan ng
Lady mangha naibigay na -
kaya ang bar na ito ay nangangahulugan naibigay na -
Nakita ko ang salitang "sanggol." Ba na magkaroon ng kahulugan?
Kaya sinusubukan ko upang makalkula na bagay na maaaring mangyari.
>> Kaya mayroong ito teorama na tinatawag na Bayes teorama na nagsasabing na ang
posibilidad ng isang naibigay na B, ay ang posibilidad ng B ibinigay na A, beses ang
posibilidad ng A, sa ibabaw ng probabilidad ng B. Ito ay isang mahaba ang equation.
Ngunit ano ang mayroon ka upang maunawaan mula sa na na ito ang gusto kong i-
kalkulahin, tama?
Kaya ang posibilidad na mangyari na ang kanta ay sa pamamagitan ng Lady mangha naibigay na nakita ko ang salitang
"Sanggol."
>> At ngayon kung ano Nakakakuha ako ay ang posibilidad ng ang salitang "sanggol" na ibinigay
na mayroon akong Lady mangha.
At kung ano ay ang isa lamang?
Ano paraan iyon ay, kung ano ang posibilidad na makakita ng salitang "sanggol"
sa mangha lyrics?
Kung gusto ko upang kalkulahin na sa isang napaka- simpleng paraan, ito ay lamang ang bilang ng mga
beses nakakakita ng "sanggol" sa ibabaw ang kabuuang bilang ng mga salita sa mangha lyrics, tama?
Ano ay ang dalas na nakikita ko ang salitang iyon sa trabaho mangha ni?
Magkaroon ng kahulugan?
>> Ang ikalawang termino ay ang posibilidad ng mangha.
Ano ang ibig sabihin na?
Iyon talaga ay nangangahulugan, ano ang posibilidad ng pag-uuri
ilang lyrics bilang mangha?
At iyon ay uri ng kakaiba, ngunit ni sa tingin ng isang halimbawa ipaalam.
Kaya sabihin nating na ang posibilidad ng pagkakaroon ng "sanggol" sa isang kanta ay pareho
para sa mangha at Britney Spears.
Ngunit Britney Spears ay may dalawang beses higit pang mga kanta kaysa Lady mangha.
Kaya kung may isang taong random na lamang ay nagbibigay sa iyo lyrics ng "sanggol," ang unang bagay na sa iyo
tumingin sa ay, kung ano ay ang posibilidad ng pagkakaroon ng "sanggol" sa isang mangha kanta, "sanggol"
sa isang Britney kanta?
At ito ay ang parehong bagay.
>> Kaya ang ikalawang bagay na makikita mo ay, well, ano ang posibilidad ng
tula ng damdamin ito sa pamamagitan ng sarili nito sa pagiging isang mangha tula ng damdamin, at kung ano ay ang posibilidad ng
pagiging isang Britney tula ng damdamin?
Kaya mula noong Britney ay may kaya marami pang lyrics kaysa mangha, gagawin mo marahil
sabihin nating, na rin, ito ay marahil isang Britney tula ng damdamin.
Kaya na ang dahilan kung bakit mayroon kaming ito TERM dito mismo.
Posibilidad ng mangha.
Saysay ang?
Gumagana ba ito?
OK.
>> At ang huli lamang ang posibilidad ng "sanggol" na hindi
talagang bagay na magkano.
Ngunit ito ay ang posibilidad ng nakakakita ng "sanggol" sa Ingles.
Namin karaniwang hindi pinapahalagahan na magkano ang tungkol sa term na iyon.
Ba na magkaroon ng kahulugan?
Kaya ang posibilidad ng mangha ay na tinatawag na ang bago probabilidad
ng klase mangha.
Dahil nangangahulugan ito na lang, ano ang posibilidad ng pagkakaroon ng klase na -
na kung saan ay mangha -
lamang sa pangkalahatan, lamang na walang mga kundisyon.
>> At pagkatapos ay kapag mayroon akong posibilidad ng Mangha ibinigay na "sanggol," tawagan namin ito plus
teary isang posibilidad na mangyari ito dahil ito ay ang posibilidad ng pagkakaroon
Mangha ibinigay na ang ilang patunay.
Kaya ako nagbibigay sa iyo ng katibayan na nakita ko ang salitang sanggol at
ang kanta magkaroon ng kahulugan?
OK.
>> Kaya Kung ako kinakalkula na para sa bawat ng mga kanta para sa Lady mangha,
ano na magiging -
sa malas, hindi ako maaaring ilipat ito.
Ang posibilidad ng mangha ay magiging isang bagay tulad ng, 2 sa paglipas ng 24, beses 1/2,
sa paglipas ng 2 sa ibabaw 53.
Hindi mahalaga kung alam mo kung ano ang ang mga numero ay nagmumula sa.
Ngunit ito ay isang numero lamang na pagpunta na maging mas kaysa sa 0, tama?
>> At pagkatapos ay kapag gagawin ko Katy Perry, ang posibilidad ng "sanggol" ibinigay na Katy ay
na 0, tama?
Dahil walang "sanggol" sa Katy Perry.
Kaya pagkatapos ito ay nagiging 0, at mangha panalo, na nangangahulugan na mangha ay
marahil ang mang-aawit.
Ba na magkaroon ng kahulugan?
OK.
>> Kaya kapag gusto kong gumawa ito nang higit pa opisyal, Maaari ko talagang gawin ang isang modelo
para sa maramihang salita.
Kaya sabihin nating na mayroon akong isang bagay tulad ng, "sanggol, Ako
sa sunog, "o isang bagay.
Kaya mayroon itong maraming salita.
At sa kasong ito, maaari mong makita ang na "sanggol" ay nasa mangha,
pero hindi sa Katy.
At "apoy" ay nasa Katy, ngunit hindi ito sa mangha, tama?
Kaya nakakakuha ito ng trickier, tama?
Dahil ito ay tila na sa iyo halos mayroon ang kurbatang sa pagitan ng dalawang.
>> Kaya kung ano ang kailangan mo lang gawin ay ipinapalagay malayang bansa kabilang sa mga salita.
Kaya talaga kung ano ang ibig sabihin nito ay ay na Lang ako sa pagkalkula ng kung ano ang
posibilidad na makakita ng "sanggol," kung ano ang ang posibilidad na makakita ng "ko," at
"Kasama", at "sa," at "apoy," lahat nang hiwalay.
Pagkatapos ako ng pag-multiply ang lahat ng mga ito.
At ako nakakakita ng ano ay ang probabilidad na makita ang buong pangungusap.
Magkaroon ng kahulugan?
>> Kaya talaga, kung mayroon akong salita ng isa lang, kung ano ang gusto kong makahanap ay ang ARG max,
na nangangahulugan, ano ang class na iyon ay pagbibigay sa akin ng pinakamataas na posibilidad?
Kaya kung ano ay ang klase na nagbibigay sa sa akin ang pinakamataas na posibilidad para sa
posibilidad ng klase ibinigay na salita.
Kaya sa kasong ito, mangha ibinigay na "sanggol." O Katy ibinigay na "sanggol." Magkaroon ng kahulugan?
>> At lamang mula Bayes, na equation na ako ay nagpakita,
lumikha namin ito fraction.
Ang tanging bagay ay na nakikita mo na ang posibilidad ng salita na nabigyan ng
pagbabago klase depende sa klase, tama?
Ang bilang ng mga "sanggol" s na mayroon akong sa mangha ay naiiba mula sa Katy.
Ang posibilidad ng klase din pagbabago dahil ito ay lamang ang bilang
ng kanta bawat isa sa kanila ay may.
>> Ngunit ang posibilidad ng mga salita mismo ay magiging pareho sa lahat ng mga
artist, tama?
Kaya ang posibilidad ng ang salita ay lamang, ano ang posibilidad ng
nakikita na salita sa Ingles wika?
Kaya ito ang parehong para sa lahat ng mga ito.
Kaya dahil ito ay pare-pareho, kaya namin lamang i-drop ito at hindi na mahalaga ang tungkol dito.
Kaya ito ay magiging talagang ang equation kaming naghahanap ng para sa.
>> At kung mayroon akong maramihang mga salita, ako pagpunta pa rin na magkaroon ng bago
bagay na maaaring mangyari dito.
Ang tanging bagay ay na ako multiply ang posibilidad ng
lahat ng iba pang mga salita.
Kaya ako multiply lahat ng mga ito.
Magkaroon ng kahulugan?
Mukhang kakaiba ngunit isa lamang ay nangangahulugan, kalkulahin ang naunang ng klase, at
pagkatapos ay i-multiply sa pamamagitan ng ang posibilidad ng bawat sa mga salita na nasa loob ng klase na iyon.
>> At alam mo na ang posibilidad ng isang ibinigay na isang klase ng salita ay magiging ang
dami ng beses na nakikita mo na ang salita sa class na iyon, na hinati sa bilang ng mga
mga salita na mayroon ka sa na class na sa pangkalahatan.
Magkaroon ng kahulugan?
Ito ay lamang kung paano "sanggol" ay 2 sa ibabaw ang bilang ng mga salita na
Nagkaroon na ako sa lyrics.
Kaya lang ang dalas.
>> Subalit mayroong isang bagay.
Natatandaan kung paano ako ay ipinapakita na ang posibilidad ng "sanggol" pagiging lyrics
mula Katy Perry ay 0 dahil lang sa Katy Perry ay walang "sanggol" sa lahat?
Ngunit ito tunog ng kaunti masakit sa tainga upang lamang sabihin lang na lyrics ay hindi maaaring maging mula sa
isang artist dahil lang wala silang na salita sa partikular na sa anumang oras.
>> Kaya maaari mo lamang sabihin, na rin, kung ikaw walang salitang ito, ako pagpunta sa
bigyan ka ng isang mas mababang posibilidad na mangyari, ngunit ako lamang ay hindi pagpunta sa
magbibigay sa iyo ng 0 agad-agad.
Dahil siguro ito ay isang bagay tulad ng, "Sunog, sunog, sunog, sunog," kung saan ay
lahat-lahat Katy Perry.
At pagkatapos ay ang "sanggol," at ito lamang ang papunta sa 0 kaagad dahil nagkaroon ng isa
"Sanggol."
>> Kaya talaga kung ano ang ginagawa namin ay isang bagay tinatawag Laplace smoothing.
At ito lamang ay nangangahulugan na ako ng pagbibigay sa ang ilang mga bagay na maaaring mangyari kahit na sa mga salita
na hindi umiiral.
Kaya kung ano ang gagawin ko ay na kapag ako ay nagkakalkula ito, palaging ako magdagdag ng 1 sa
ang tagabilang.
Kaya kahit na ang salita ay hindi umiiral, sa kasong ito, kung ito ay 0, pa rin ako
nagkakalkula ito ng 1 sa ibabaw ng kabuuang bilang ng mga salita.
Kung hindi man, nakakatanggap ako ng kung gaano karaming mga salita Mayroon akong at idagdag ko 1.
Kaya ako ng pagbibilang para sa parehong mga kaso.
Magkaroon ng kahulugan?
>> Kaya gawin ng ilang mga coding ngayon hayaan.
Pupunta ako sa mayroon na gawin ito medyo mabilis, ngunit mahalagang lamang na
guys maintindihan ang konsepto.
Kaya kung ano ang sinusubukan naming gawin ay eksakto ipatupad ang
bagay na ko lang ang sinabi -
Gusto ko mong ilagay lyrics mula sa Lady mangha at Katy Perry.
At ang mga programa ay pagpunta sa magagawang sabihin kung ang mga bagong lyrics ay mula sa mangha
o Katy Perry.
Magkaroon ng kahulugan?
OK.
>> Kaya Mayroon akong ito programa pupuntahan ko upang tumawag classify.py.
Kaya ito ay Python.
Ito ay isang bagong wika programming.
Ito ay katulad na katulad sa ilan mga paraan upang C at PHP.
Ito ay katulad dahil kung nais mong matuto Python pagkatapos ng pag-alam C, ito ay
talagang hindi na karami ng isang hamon dahil lang sa Python ay lubhang mas madaling
kaysa C, una sa lahat.
At may maraming mga bagay ang na ipinapatupad para sa iyo.
Kaya lang kung paano tulad ng PHP ay may mga pag-andar na -uri-uriin ang listahan, o magkabit ng isang bagay
sa isang array, o blah, blah, blah.
Python ay pati na rin ang lahat ng mga iyon.
>> Kaya ako lamang ang pagpunta sa ipaliwanag mabilis paano namin magagawa ang pag-uuri
problema para dito.
Kaya sabihin nating na sa kasong ito, mayroon akong lyrics mula mangha at Katy Perry.
Ang paraan na mayroon akong mga lyrics ay na ang unang salita ng lyrics ay
ang pangalan ng artist, at ang natitira ay ang lyrics.
Kaya sabihin nating na mayroon akong listahan na ito sa kung saan ang unang isa ay lyrics ng mangha.
Kaya dito ako sa kanan track.
At sa susunod na isa ay Katy, at ito ay may lyrics din.
>> Kaya ito ay kung paano mo idedeklara isang variable sa Python.
Hindi mo kailangang ibigay ang uri ng data.
Isulat mo lang ang "lyrics," uri ng nais sa PHP.
Magkaroon ng kahulugan?
>> Kaya ano ang mga bagay na mayroon akong upang kalkulahin upang magagawang upang makalkula ang
probabilities?
Mayroon akong upang makalkula ang "priors" ng bawat isa sa mga iba't ibang
mga klase na mayroon akong.
Mayroon akong upang makalkula ang "posteriors," o medyo magkano ang probabilities ng
bawat isa sa mga iba't ibang mga salita na Maaari ba akong magkaroon ng para sa bawat artist.
Kaya sa loob mangha, halimbawa, pupuntahan ko upang magkaroon ng isang listahan ng kung gaano karaming beses nakikita ko
bawat isa sa mga salita.
Magkaroon ng kahulugan?
>> At sa wakas, ako lamang ang pagpunta upang magkaroon ng isang listahan na tinatawag na "salita" na lamang ng pagpunta
upang magkaroon ng kung gaano karaming mga salita ko mayroon para sa bawat artist.
Kaya para sa mangha, halimbawa, kapag tumingin ako sa lyrics, ako ay, sa palagay ko, 24
mga salita sa kabuuan.
Kaya list na ito ay lamang ng pagpunta sa may Mangha 24, at Katy ibang numero.
Magkaroon ng kahulugan?
OK.
>> Kaya ngayon, talaga, sabihin pumunta sa coding.
Kaya sa Python, maaari mo talaga bumalik ng grupo ng mga iba't ibang
mga bagay mula sa isang function.
Kaya ako pupunta upang likhain ang function na na tinatawag na "kondisyon," na kung saan ay pagpunta
upang bumalik sa lahat ng mga bagay, ang "Priors," ang "probabilities," at ang
"Salita." Kaya "kondisyon," at ito ay pagpunta sa ay pagtawag sa mga "lyrics."
>> Kaya ngayon ay nais ko sa iyo upang aktwal na isulat ito function.
Kaya ang paraan na maaari kong isulat ito function ay natukoy ko lang ito
function na may "def." Kaya ginawa ko "def may pasubali, "at tumatagal
"Lyrics." At kung ano ito ay pagpunta sa gawin ay, una sa lahat, mayroon ko ang aking priors
na gusto kong kalkulahin.
>> Kaya ang paraan na maaari kong gawin ito ay lumikha isang diksyunaryo sa Python, na
ay medyo magkano ang parehong bagay bilang isang hash talahanayan, o ito ay tulad ng isang umuulit
array sa PHP.
Ito ay kung paano Ipinahahayag ko isang diksiyunaryo.
At talaga kung ano ang ibig sabihin nito ay na priors ng mangha ay 0.5, halimbawa, kung
50% ng mga lyrics ay mula sa Mangha, 50% ay mula sa Katy.
Magkaroon ng kahulugan?
Kaya kailangan kong malaman kung paano upang makalkula ang priors.
>> Ang susunod na mga bago na kailangan kong gawin, din, ang mga probabilities at ang mga salita.
Kaya ang probabilities ng mangha ay ang listahan ng lahat ng mga probabilities na ako
mayroon para sa bawat isa sa mga salita para sa mangha.
Kaya kung pumunta ako sa probabilities ng mangha "Sanggol," halimbawa, ito makikita ninyo ako
isang bagay tulad ng 2 sa paglipas ng 24 sa kasong iyon.
Magkaroon ng kahulugan?
Kaya pumunta ako sa "probabilities," pumunta sa "Mangha" bucket na may isang listahan ng lahat ng
ang mangha salita, pagkatapos ay pumunta ako sa "sanggol," at nakikita ko ang posibilidad.
>> At sa wakas Mayroon akong na ito "Salita" na diksiyunaryo.
Kaya dito, "probabilities." At pagkatapos ay "Salita." Kaya kung gagawin ko "salita," "mangha,"
kung ano ang mangyayari ay na ito pagpunta sa magbibigay sa akin 24, nagsasabi na ako
may 24 salita sa loob lyrics mula sa mangha.
Saysay ang?
Kaya dito, "salita" ay katumbas ng dah-dah-dah.
OK
>> Kaya kung ano pupuntahan ko lang gawin ay pupuntahan ko umulit sa paglipas ng bawat isa sa mga lyrics, kaya
bawat isa sa mga string na Mayroon akong sa listahan.
At ako pupunta upang makalkula ang mga bagay para sa bawat isa sa mga kandidato.
Saysay ang?
Kaya kailangan kong gawin para sa isang loop.
>> Kaya sa Python kung ano ang maaari kong gawin ay "para sa mga line sa lyrics. "Ang parehong bagay bilang isang
"Para sa bawat" na statement sa PHP.
Natatandaan kung paano kung ito ay PHP ng dati ko sabihin "para sa bawat lyrics bilang
linya. "Gumagawa kahulugan?
Kaya ako pagkuha sa bawat isa sa mga linya, sa ganitong kaso, ang string na ito at ang susunod na
string kaya para sa bawat isa sa mga linya ng kung ano ako pagpunta sa gawin ay una, pupuntahan ko
hatiin ang linyang ito sa isang listahan ng mga salita pinaghiwalay ng mga puwang.
>> Kaya ang mga cool na bagay tungkol sa Python ay na maaari mo lamang ng Google tulad ng "paano maaari ako
hatiin isang string sa mga salita? "At ito ay pagpunta sa sabihin sa iyo kung paano ito gawin.
At ang paraan upang gawin ito, ito ay linya lang ang " = Line.split () "at ito ay isa lamang
pagpunta sa magbibigay sa iyo ng isang listahan na may bawat isa sa mga salita dito.
Saysay ang?
Kaya ngayon na ginawa ko na gusto kong malaman sino ay ang mang-aawit ng na kanta.
At gawin na akong magkaroon lamang upang makuha ang unang elemento ng array, tama?
Kaya ko maaaring lamang sabihin na ako "mang-aawit = Linya (0) "Gumagawa kahulugan?
>> At pagkatapos ay kung ano ang kailangan kong gawin ay, una sa lahat, ako pagpunta sa i-update ang kung gaano karaming
salita Mayroon akong sa ilalim ng "mangha." kaya ako lamang pagpunta sa kalkulahin kung gaano karaming mga salita ko
mayroon sa listahang ito, tama?
Dahil ito kung gaano karaming mga salita Mayroon akong sa lyrics at lang pupuntahan ko
idagdag ito sa ang "mangha" array.
Ba na magkaroon ng kahulugan?
Huwag tumutok masyadong maraming sa syntax.
Mag-isip nang higit pa tungkol sa mga konsepto.
Iyan ang pinaka-mahalagang bahagi.
OK.
>> Kaya kung ano ang maaari kong gawin ito kung "mangha" ay Nasa listahan na iyon, kaya "kung mang-aawit sa
mga salitang "na nangangahulugang ko na may mga salita sa pamamagitan ng mangha.
Gusto ko lang upang idagdag ang mga karagdagang mga salita sa na.
Kaya kung ano ang gagawin ko ay "salita (mang-aawit) + = Len (linya) - 1 ".
At pagkatapos ay ako maaaring lamang gawin ang haba ng linya.
Kaya kung gaano karaming mga elemento ko mayroon sa array.
At kailangan kong gawin minus 1 dahil lang sa unang elemento ng array ay lamang
isang mang-aawit at mga hindi lyrics.
Saysay ang?
OK.
>> "Iba Pa," ang ibig sabihin nito na gusto kong talaga isingit mangha sa listahan.
Kaya lang gagawin ko "salita (mang-aawit) = Len (linya) - 1, "paumanhin.
Kaya ang tanging pagkakaiba sa pagitan ng dalawang mga linya ay na ang isang ito, hindi
umiiral pa, kaya ako lamang Sinisimulan ito.
Isa ito ako talaga ng pagdaragdag.
OK.
Kaya ito ay pagdaragdag sa mga salita.
>> Ngayon gusto kong magdagdag sa priors.
Kaya paano ko makalkula ang priors?
Ang priors maaaring kalkulahin sa pamamagitan ng kung gaano karaming beses.
Kaya kung gaano karaming beses mo makita na mang-aawit sa lahat ng mga mang-aawit na
mayroon, i-right?
Kaya para sa mangha at Katy Perry, sa kasong ito, nakikita ko mangha
isang beses, Katy Perry-sabay.
>> Kaya isa lamang ang priors para sa mangha at para sa Katy Perry gagawin
maging isa lamang, tama?
Ikaw lang kung paano maraming beses Nakikita ko ang artist.
Kaya ito ay mas madali upang kalkulahin.
Maaari akong magkaroon lamang katulad na bilang tulad ng "kung mang-aawit sa priors, "ako lamang ng pagpunta
magdagdag ng 1 sa kanilang mga kahon priors.
Kaya, "priors (kumanta)" + = 1 "at pagkatapos ay" iba pa " Pupunta ako sa ginagawa "priors (mang-aawit)
= 1. "Gumagawa kahulugan?
>> Kaya kung hindi nito umiiral kong ilagay lamang bilang 1, kung hindi, idagdag ko lang 1.
OK, kaya ngayon lahat na ako ang natitira upang gawin ay idagdag din sa bawat isa sa mga salita sa
probabilities.
Kaya Mayroon akong upang mabilang kung gaano karaming beses Nakikita ko sa bawat isa sa mga salita.
Kaya Mayroon akong lamang na gawin ang isa pang para sa loop sa linya.
>> Kaya unang bagay na ako pagpunta sa gawin ay suriin kung ang mang-aawit ay mayroon nang
probabilities ng array.
Kaya Lalabas na ako kung ang mang-aawit ay hindi magkaroon ng isang probabilities array, lamang ako
pagpunta sa pagsisimula ng isa para sa kanila.
Ito ay hindi kahit na isang array, paumanhin, ito ay isang diksiyunaryo.
Kaya ang probabilities ng mang-aawit ay pagpunta upang maging isang bukas na diksyonaryo, kaya ako ay
Sinisimulan lamang ng isang diksyunaryo para sa mga ito.
OK?
>> At ngayon ko maaaring aktwal na gawin ang isang para sa loop upang makalkula ang bawat isa sa mga salitang '
probabilities.
OK.
Kaya kung ano ang maaari kong gawin ay isang para sa loop.
Kaya ako lamang ang pagpunta upang umulit sa ibabaw ng array.
Kaya ang paraan na maaari kong gawin na sa Python ay "para i sa range." Mula sa 1
dahil gusto ko *** magsimula sa pangalawang elemento dahil ang una ay ang
pangalan ng mang-aawit.
Kaya mula sa isa hanggang sa ang haba ng linya.
At talagang kapag ako Iba't ito pumunta mula sa tulad dito mula 1 hanggang Len ng
linya minus 1.
Kaya na gagawin nito na bagay ng paggawa n minus 1 para sa array na higit na
maginhawa.
Saysay ang?
>> Kaya para sa bawat isa sa mga, ano ang pupuntahan ko gawin ay, tulad ng sa mga iba pang isa,
Pupunta ako upang suriin kung ang mga salita sa ito posisyon sa linya ay nasa
probabilities.
At pagkatapos ng sinabi ko dito, probabilities mga salita, tulad ng sa ilagay ko
"Probabilities (mang-aawit)".
Kaya ang pangalan ng mang-aawit.
Kaya kung ito ay nasa "Probabilit (mang-aawit)", nangangahulugan ito na ako
nais na magdagdag ng 1 dito, kaya pupuntahan ko gawin "probabilities (mang-aawit)", at ang
salita ay tinatawag na "linya (i)".
Pupunta ako sa magdagdag ng 1 at "iba" Ako lamang pagpunta sa initialize ito upang 1.
"Line (i)".
Saysay ang?
>> Kaya, kinalkula ko ang lahat ng mga array.
Kaya, ngayon lahat na kailangan kong gawin para sa ang isang ito ay "bumalik lamang priors,
probabilities at mga salita Sabihin. " makita kung mayroong anumang, OK.
Mukhang lahat ng bagay ay gumagana sa ngayon.
Kaya, na ang may katuturan?
Sa ilang mga paraan?
OK.
Kaya ngayon mayroon akong ang lahat ng mga probabilities.
Kaya ngayon ang tanging bagay na ako sa kaliwa ay ang magkaroon lamang bagay na iyon
Kinakalkula ang produkto ng lahat ng mga probabilities kapag nakukuha ko ang lyrics.
>> Kaya sabihin nating na gusto kong tumawag ngayon ito function na "-uri-uriin ()" at ang
bagay na function na tumatagal ay isa lamang argumento.
Sabihin nating "Baby, na ako sa apoy" at ito ay pagpunta upang malaman kung ano ang
posibilidad na ito ay mangha?
Ano ang posibilidad na ito ay Katie?
Magaling?
Kaya ako lamang ang pagpunta sa may upang lumikha ng isang bagong function na tinatawag na "-uri-uriin ()" at
ito ay pagpunta sa tumagal ng ilang lyrics pati na rin.
At bukod sa mga lyrics ko rin kailangang magpadala ang priors, ang
probabilities at ang mga salita.
Kaya pupuntahan ko magpadala lyrics, priors, probabilities, mga salita.
>> Kaya ito ay inaabot lyrics, priors, probabilities, mga salita.
Kaya, ano ang ibig nitong gawin?
Ito talaga ay pagpunta sa pumunta sa pamamagitan ng lahat ang mga posibleng mga kandidato na iyong
mayroon bilang isang mang-aawit.
At kung saan ay ang mga kandidato?
Ang mga ito Sa priors, tama?
Kaya Mayroon akong lahat ng mga doon.
Kaya ako pupunta upang magkaroon ng isang diksyunaryo ng lahat ng posibleng mga kandidato.
At pagkatapos ay para sa bawat kandidato sa priors, kaya ibig sabihin nito na ito pupuntahan
maging mangha, Katie kung mayroon ako higit pa magiging higit pa.
Pupunta ako upang simulan ang pagkalkula ito posibilidad.
Ang posibilidad bilang nakita natin sa PowerPoint ay ang naunang beses ang
produkto ng bawat isa sa mga iba pang mga probabilities.
>> Kaya ang maaari kong gawin ang parehong dito.
Maaari ko lang gawin posibilidad ay sa una lang ang bago.
Kaya priors ng mga kandidato.
Mag-right?
At ngayon, mayroon akong upang umulit sa paglipas ng lahat ng mga mga salita na mayroon akong sa lyrics upang maging
maaari kang magdagdag ng probabilidad para sa bawat isa sa kanila, OK?
Kaya, "para sa salita sa lyrics" kung ano pupuntahan ko gawin ay, kung ang salita ay sa
"Probabilities (kandidato)", na ay nangangahulugan na ito ay isang salita na ang
kandidato ay may sa kanilang lyrics -
halimbawa, "sanggol" para sa mangha -
ano pupuntahan ko lang gawin ay na ang probabilidad ay pagpunta sa ma-multiply
sa pamamagitan ng 1 plus ang probabilities ng ang kandidato para sa salitang iyon.
At ito ay tinatawag na "salita".
Ito na hinati sa pamamagitan ng bilang ng mga salita na mayroon akong para sa kandidato na iyon.
Ang kabuuang bilang ng mga salita na mayroon akong para sa mga mang-aawit na Naghahanap ako sa.
>> "Iba Pa." ang ibig sabihin nito ito ay isang bagong salita kaya nais itong maging tulad ng halimbawa
"Apoy" para sa Lady mangha.
Kaya gusto ko lang gawin 1 sa ibabaw "Salita (kandidato)".
Kaya hindi ko nais upang ilagay ang terminong ito dito.
>> Kaya ito ay pagpunta sa maging isa lamang pagkopya at pag-paste ito.
Pero pupuntahan ko tanggalin ang bahagi na ito.
Kaya ito ay lamang ng pagpunta sa maging 1 sa ibabaw na.
Magaling?
At ngayon sa dulo, ako lamang ng pagpunta sa i-print ang pangalan ng kandidato at
ang posibilidad na mayroon ka ng pagkakaroon ng S sa kanilang lyrics.
Saysay ang?
At talagang kong gawin hindi kahit na kailangan diksyunaryo ito.
Saysay ang?
>> Kaya, sabihin makita kung ito talaga gumagana.
Kaya kung nagpatakbo ako ng ito, hindi ito gumana.
Maghintay ng isang segundo.
"Mga salita (kandidato)", "mga salita (kandidato)", na
ang pangalan ng array.
OK Kaya, sinasabi nito na mayroong ilang mga bug para sa kandidato sa priors.
Hayaan Chill akin lamang nang kaunti.
OK.
Subukan nating Hayaan.
OK.
>> Kaya nagbibigay ito ay may ito Katy Perry posibilidad ng ito beses 10 sa
May ito minus 7, at mangha beses 10 sa minus 6.
Kaya tingnan mo ito nagpapakita na mangha ay may mas mataas na posibilidad.
Kaya "Baby, Ako ay nasa Apoy" ay marahil isang mangha kanta.
Saysay ang?
Kaya ito ay kung ano ang ginawa namin.
>> Ang code na ito ay pagpunta sa-post sa online, kaya ka guys ay maaaring suriin ito.
Siguro gamitin ang ilan ito para sa kung nais mong gawin ang isang proyekto o isang bagay na katulad.
OK.
Ito ay upang ipakita lamang ano computational
kamukha aghamwika code.
Ngunit ngayon sabihin pumunta sa higit pa mataas na antas ng mga bagay-bagay.
OK.
>> Kaya ang iba pang mga problema ko ay pakikipag-usap tungkol sa -
ang problema sa pagse-segment ay ang unang ng mga ito.
Kaya mayroon kang dito Hapon.
At pagkatapos ay makita mo na walang mga puwang.
Kaya ito ay isa lamang ay nangangahulugan na ito ay sa tuktok ng upuan, tama?
Nagsasalita ka Hapon?
Ito ay sa tuktok ng upuan, tama?
>> AARAL: Hindi ko alam kung ano ang Kanji banda roon ay.
>> Lucas Freitas: Ito ay [nagsasalita ng wikang Hapon]
OK.
Kaya isa lamang ang ibig sabihin nito chair ng tuktok.
Kaya kung kayo ay nagkaroon ng upang ilagay ang isang puwang magiging dito.
At pagkatapos ay mayroon kang [? Ueda-san. ?]
Aling isa lamang ay nangangahulugan Mr Ueda.
At makikita mo na "Ueda" at mayroon kang isang espasyo at pagkatapos ay "san." Kaya nakikita mo na
dito ay mo ang "Ue" tulad ng sa pamamagitan ng mismo.
At dito ito ay may isang character sa tabi nito.
>> Kaya ito ay hindi nagkagusto sa mga wikang iyon character ibig sabihin ng salitang ito kaya mo
maglagay lamang ng maraming mga puwang.
Nauugnay ang mga character sa bawat isa.
At maaari silang maging magkasama tulad ng dalawa, tatlo, isa.
Kaya mo talagang may upang lumikha ng ilang mga uri ng paraan ng paglalagay ng mga puwang.
>> At bagay na ito ay na sa tuwing makakakuha ka ng data mula sa mga wikang iyon Asyano,
ang lahat ng bagay ay unsegmented.
Dahil walang sinuman na writes Hapon o writes Tsino na may mga puwang.
Tuwing ikaw ay sumusulat Chinese, Hapon isulat mo lamang ang lahat ng bagay
na walang mga puwang.
Ito ay hindi kahit na magkaroon ng kahulugan upang ilagay ang mga puwang.
Kaya pagkatapos ay kapag kumuha ka ng data mula sa, ang ilang mga East Asian na wika, kung nais mong
talagang gawin ang isang bagay na may na Mayroon una mong i-segment.
>> Isipin mo na ginagawa ang halimbawa ng ang lyrics walang mga patlang.
Kaya ang tanging lyrics na mayroon kang Magiging pangungusap, tama?
Pinaghihiwalay ng mga tuldok.
Ngunit pagkatapos ay nagkakaroon lamang ang pangungusap habilin hindi makakatulong talaga sa pagbibigay ng impormasyon
ng kung sino ang mga lyrics ay sa pamamagitan ng.
Mag-right?
Kaya dapat kang unang naglalagay ng mga puwang.
Kaya kung paano mo maaaring gawin iyon?
>> Kaya pagkatapos ay ang ideya ng isang wika modelo na kung saan ay isang bagay na talagang
mahalaga para sa computational aghamwika.
Kaya isang modelo wika ay isa lamang talaan ng mga probabilities na palabas
una sa lahat kung ano ay ang probabilidad ng pagkakaroon ng salita sa isang wika?
Kaya nagpapakita kung paano frequent isang salita ay.
At pagkatapos ay din na ipinapakita ang kaugnayan sa pagitan ng mga salita sa isang pangungusap.
>> Kaya ang pangunahing ideya ay, kapag pumunta ang isang taong hindi kilala sa iyo at sinabi ng isang pangungusap upang
mo, ano ang posibilidad na, para sa Halimbawa, "ito ay ang aking kapatid na babae [? GTF"?]
ay ang pangungusap na sinabi ng tao?
Kaya malinaw naman ang ilang mga pangungusap ay mas karaniwang kaysa sa iba.
Halimbawa, "magandang umaga," o "mahusay gabi, "o" hey doon, "ay higit pa
karaniwan kaysa sa karamihan ng mga pangungusap mayroon kaming isang Ingles.
Kaya bakit ay ang mga pangungusap higit pang mga frequent?
>> Una sa lahat, ito ay dahil mayroon kang mga salita na mas madalas.
Kaya, halimbawa, kung sabihin mo, ang aso ay malaki, at ang aso ay lubhang malaki, sa iyo
Karaniwang malamang marinig ang aso ay malaki nang mas madalas dahil ang "malaki" ay higit pa
madalas sa Ingles kaysa sa "katakut-takot ang laki." Kaya, ang isa sa mga
mga bagay ay ang salita dalas.
>> Ang ikalawang bagay na kung saan ay talagang kahalaga lamang ang
pagkakasunud-sunod ng mga salita.
Kaya, ito ay karaniwang magsabi ng "ang pusa ay sa loob ng kahon. "ngunit hindi mo gawin karaniwan
makita sa "na kahon ang loob ay ang pusa." kaya nakikita mo na mayroong ilang kahalagahan
sa pagkakasunud-sunod ng mga salita.
Hindi mo maaaring lamang sabihin na ang dalawang pangungusap na magkaroon ng parehong bagay na maaaring mangyari
dahil lamang mayroon sila ang parehong mga salita.
Ikaw talaga kailangang pinapahalagahan tungkol sa order pati na rin.
Magkaroon ng kahulugan?
>> Kaya kung ano ang gagawin namin?
Kaya kung ano ang maaaring subukan ko upang makakuha ng sa iyo?
Sinusubukan ko upang makakuha ng sa iyo kung ano ang aming tawagan ang mga modelong n-gramo.
Kaya isa lamang ipagpalagay n-gramo modelo na sa bawat salita na
mayroon ka sa isang pangungusap.
Ito ay ang posibilidad ng pagkakaroon na salita doon ay nakasalalay hindi lamang sa mga
dalas ng salitang iyon sa wika, ngunit pati rin sa mga salita na
ay sa paligid nito.
>> Kaya halimbawa, karaniwan kapag nakita mo isang bagay tulad ng sa o sa ikaw ay
marahil pagpunta upang makita ang isang pangngalan matapos na ito, i-right?
Dahil kapag mayroon kang isang pang-ukol Karaniwang tumatagal ng isang pangngalan pagkatapos nito.
O kaya kung mayroon kang isang pandiwa na palipat na karaniwan mong pupunta sa
magkaroon ng isang pangngalan parirala.
Kaya ito ay pagpunta sa magkaroon ng isang pangngalan sa isang lugar sa paligid nito.
>> Kaya, talaga, kung ano ang ginagawa nito ay tumutulong ito Isinasaalang-alang ang posibilidad ng pagkakaroon
mga salita sa tabi ng bawat isa, kapag ka pagkalkula ng mga
posibilidad ng isang pangungusap.
At iyon ang isang wika modelo ay isa lamang.
Sinasabi lang kung ano ang mga posibilidad ng pagkakaroon ng isang tiyak na
pangungusap sa isang wika?
Kaya bakit ay na kapaki-pakinabang, talaga?
At una sa lahat kung ano ang isang modelo ng n-gramo, pagkatapos?
>> Kaya isang modelo ng n-gramo ay nangangahulugan na bawat salita ay depende sa
susunod N minus 1 salita.
Kaya, talaga, nangangahulugan ito na kung tumingin ako, halimbawa, sa CS50 tf kapag
Ako sa pagkalkula ng ang posibilidad ng ang pangungusap, magiging tulad ng "ang
posibilidad ng pagkakaroon ng salitang "ang" beses ang posibilidad ng pagkakaroon ng "mga
CS50 "beses ang posibilidad ng pagkakaroon "Ang CS50 tf." Kaya, talaga, bilangin ko
lahat ng posibleng paraan ng lumalawak ito.
>> At pagkatapos ay karaniwan kapag ginagawa mo ito, bilang sa isang proyekto, ilagay mo N upang maging
isang mababang halaga.
Kaya, karaniwang may bigrams o trigrams.
Kaya na bilangin mo lamang ang dalawang salita, isang grupo ng mga dalawang salita, o tatlong mga salita,
lamang para sa mga isyu sa pagganap.
At dahil din siguro kung mayroon kang isang bagay tulad ng "Ang CS50 tf." Kapag nag-
mayroon "tf," ito ay napakahalaga na "CS50" ay sa tabi nito, tama?
Yaong dalawang bagay ay karaniwang sa tabi ng bawat isa.
>> Kung sa tingin mo ng "tf," marahil ito ay pagpunta sa may ano
class na ito TF'ing para sa.
Gayundin "ang" ay talagang mahalaga para sa CS50 tf.
Ngunit kung mayroon kang isang bagay tulad ng "Ang CS50 Tf napunta sa mga klase at binigyan ang kanilang
mga mag-aaral ng ilang mga kendi. "" Candy "at" ang " Mayroong ganap na walang kaugnayan, tama?
Ang mga ito ay kaya malayo mula sa bawat isa na ito ay hindi talagang mahalaga kung ano
mga salita na mayroon ka.
>> Kaya sa pamamagitan ng paggawa ng isang bigram o isang trigram, ito Nangangahulugan lamang na kayo ay nililimitahan
ang iyong sarili sa ilan sa mga salita na paligid.
Magkaroon ng kahulugan?
Kaya kapag gusto mong gawin sa pagse-segment, talaga, ano ang gusto mong gawin ay ang tingnan
ano ay ang lahat ng posibleng paraan na maaari mong i-segment ang pangungusap.
>> Ang nasabing na makita mo kung ano ang probabilidad ng bawat isa sa mga pangungusap
umiiral sa wika?
Kaya kung ano ang ginagawa mo ay tulad ng, well, sabihin sa akin subukang maglagay ng espasyo dito.
Kaya kang maglagay ng space doon at iyong makikita kung ano ang
posibilidad ng pangungusap na?
Pagkatapos ay ikaw ay tulad, OK, siguro na noon ay hindi na mahusay.
Kaya ko *** ilagay ang isang puwang doon at isang puwang doon, at kayo na kalkulahin ang
bagay na maaaring mangyari ngayon, at nakikita mo na ito ay isang mas mataas na posibilidad.
>> Kaya ito ay isang algorithm na tinatawag na ang Tango segmentation algorithm, na kung saan ay
talagang isang bagay na magiging talagang cool na para sa isang proyekto, na
talaga tumatagal unsegmented teksto na ay maaaring maging Hapon o Tsino o siguro
Ingles walang mga patlang at sinusubukang upang ilagay puwang sa pagitan ng mga salita at ginagawa nito
na sa pamamagitan ng paggamit ng isang modelo ng wika at sinusubukan upang makita kung ano ay ang pinakamataas na
bagay na maaaring mangyari maaari kang makakuha ng.
OK.
Kaya ito ay segmentation.
>> Ngayon syntax.
Kaya, syntax ay ginagamit para sa sa ngayon kaya maraming bagay.
Kaya para sa Graph Search, para sa Siri para sa halos anumang uri ng natural
pagproseso ng wika mayroon ka.
Kaya ano ang mga mahahalagang bagay tungkol sa syntax?
Kaya, mga pangungusap sa pangkalahatan mayroon ang tinatawag naming mga nasasakupan.
Aling mga uri ng tulad ng mga grupo ng mga salita na may isang function sa pangungusap.
At hindi sila talaga ay maaaring maging bukod sa isa't isa.
>> Kaya, kung sinasabi ko, halimbawa, "nagmamahal Lauren Milo. "Alam ko na" Lauren "ay isang
bumubuo at pagkatapos ay "nagmamahal Milo "ay din isa pa.
Dahil hindi ka maaaring sabihin tulad ng "Lauren Milo nagmamahal "na magkaroon ng parehong kahulugan.
Hindi ito pagpunta sa may ang parehong kahulugan.
O kaya hindi ko masabi tulad ng "Milo Lauren nagmamahal. "Hindi lahat ng bagay ay may parehong
ibig sabihin ginagawa na.
>> Kaya ang dalawang higit pang mahahalagang bagay tungkol sa syntax ay ang mga leksiko mga uri na kung saan ay
talaga ang function na sa iyo mayroon sa pamamagitan ng kanilang sarili para sa mga salita.
Kaya kailangan mong malaman na "Lauren" at "Milo" ay nouns.
"Pag-ibig" ay isang pandiwa.
At ang pangalawang mahalagang bagay ay na sila phrasal uri.
Kaya alam mo na "nagmamahal Milo" ay talagang isang pandiwang parirala.
Kaya kapag sinabi ko "Lauren," Alam ko na Lauren ay paggawa ng isang bagay.
Ano ang siya ginagawa?
Siya ay mapagmahal Milo.
Kaya ito ay isang buong bagay.
Ngunit mga bahagi nito ay isang pangngalan at pandiwa.
Ngunit nang magkasama, gumawa sila ng isang pandiwa parirala.
>> Kaya, kung ano ang maaari naming talagang gawin sa computational aghamwika?
Kaya, kung mayroon akong isang bagay halimbawa "Mga kaibigan ng mga Allison." Tingnan ko kung ko lang
ay isang sintaktik puno gusto kong malaman na "Mga kaibigan" ay isang pangngalan parirala ito ay isang
pangngalan at pagkatapos "ng Allison" ay isang preposisyonal parirala na kung saan ang "ng" ay
isang paksa sa pagtatalo at "Allison" ay isang pangngalan.
Ano kaya kong gawin ay turuan ang aking computer na kapag mayroon akong isang pangngalan parirala isa at
pagkatapos a preposisyonal parirala.
Kaya sa kasong ito, "mga kaibigan" at pagkatapos "ng Milo "Alam ko na ito ay nangangahulugan na
NP2, ang pangalawang isa, nagmamay-ari ng NP1.
>> Kaya ang maaari kong lumikha ng ilang mga uri ng kaugnayan, ang ilang mga uri ng pag-andar para sa mga ito.
Kaya sa tuwing nakakakita ako ng istraktura na ito, na eksaktong tumutugma sa "mga kaibigan ng
Allison, "Alam ko na Allison nagmamay-ari ng mga kaibigan.
Kaya ang mga kaibigan ng isang bagay na may Allison.
Saysay ang?
Kaya ito ay isa lamang sa kung ano ang Graph ng Paghahanap gumagana.
Ito ay lumilikha lamang panuntunan para sa maraming mga bagay.
Kaya "mga kaibigan ng mga Allison," "ang aking mga kaibigan na nakatira sa Cambridge, "" ang aking mga kaibigan
sino ang pumunta sa Harvard. "lumilikha ito ng mga panuntunan para sa lahat ng mga bagay.
>> Ngayon machine translation.
Kaya, machine translation ding isang bagay istatistika.
At talagang kung ikaw ay makakuha kasangkot sa computational aghamwika, ng maraming
iyong bagay-bagay ay magiging istatistika.
Kaya bilang ako ay ginagawa sa halimbawa sa ng maraming probabilities na ako ay
pagkalkula, at pagkatapos mong makakuha ng sa na ito napakaliit na bilang iyon ang huling
bagay na maaaring mangyari, at iyon ang Nagbibigay sa iyo ang kasagutan.
Gumagamit din ang pagsasalin ng computer isang statistical modelo.
At kung gusto mong mag-isip ng machine pagsasalin sa pinakasimpleng posibleng
paraan, ano ang maaari mong tingin lamang isalin sa salita sa pamamagitan ng salita, tama?
>> Kapag naka-pag-aaral ng wika para sa unang pagkakataon, na karaniwang kung ano
gagawin mo, tama?
Kung gusto mong ikaw isalin ang isang pangungusap sa iyong wika sa wika
naka-aaral, kadalasang una, ikaw isalin sa bawat isa sa mga salita
isa-isa, at pagkatapos mong subukan upang ilagay ang mga salita sa lugar.
>> Kaya kung nais kong isalin ito, [Nagsasalita Portuges]
na nangangahulugang "ang bumangga ang puting pusa ang layo." Kung Nais kong isalin ito mula sa
Portuges sa Ingles, kung ano ang aking maaaring gawin ay, una, ako lamang
isalin sa salita sa pamamagitan ng salita.
Kaya "o" ay "ang," "gato," "pusa," "Branco," "puti," at pagkatapos ay "fugio" ay
"Ang bumangga ang layo."
>> Kaya pagkatapos Mayroon akong lahat ng mga salita dito, ngunit wala ang mga ito sa pagkakasunud-sunod.
Ito ay tulad ng "ang bumangga ang pusa puti ang layo" na kung saan ay ungrammatical.
Kaya, pagkatapos ay maaari akong magkaroon ng isang pangalawang hakbang, na Pupunta na paghahanap ng isang perpektong
posisyon para sa bawat isa sa mga salita.
Kaya alam ko na talagang gusto kong magkaroon "Puting pusa" sa halip na "pusa puti." Kaya
kung ano ang maaari kong gawin ay, ang pinaka-walang muwang pamamaraan ay magiging upang lumikha ng lahat ng mga
posibleng permutations ng mga salita, ng mga posisyon.
At pagkatapos ay makita kung aling isa ay ang pinakamataas na posibilidad ayon
sa aking modelo wika.
At pagkatapos ay kapag mahanap ko ang isa na may ang pinakamataas na posibilidad na ito, na kung saan ay
marahil "ang bumangga ang puting pusa ang layo," na ang aking pagsasalin.
>> At ito ay isang simpleng paraan ng nagpapaliwanag kung paano ang isang maraming mga pagsasalin ng computer
algorithm gumagana.
Ba na magkaroon ng kahulugan?
Ito ay din ng isang bagay na talagang kapana-panabik na na ka guys maaari siguro galugarin para sa isang
huling proyekto, oo?
>> AARAL: Well, sinabi mo ay ang walang muwang paraan, kaya kung ano ang
ang non-walang muwang paraan?
>> Lucas Freitas: Ang mga non-walang muwang paraan?
OK.
Kaya ang unang bagay na masama tungkol sa ang pamamaraan na ito ay na ang ko lang ang na-translate na
salita, salita ng salita.
Ngunit minsan mayroon kang mga salita na maaaring magkaroon ng maramihang mga pagsasalin.
Pupunta ako sa subukang mag-isip ng isang bagay.
Halimbawa, "Manga" sa Portuges lata alinman maging "sumira" o "manggas." Kaya
kapag sinusubukan mong i-translate ang salita sa pamamagitan ng salita, maaaring ito ay nagbibigay sa iyo ng
isang bagay na ginagawang walang kahulugan.
>> Kaya mo talagang nais na tumingin ka sa lahat ang mga posibleng mga pagsasalin ng
mga salita at makita, una sa lahat, ano ang order.
Kami ay pakikipag-usap tungkol sa permutating ang bagay?
Upang makita ang lahat ng posibleng mga order at piliin ang isa na may pinakamataas na
bagay na maaaring mangyari?
Maaari mo ring piliing ang lahat ng posibleng pagsasaling-wika para sa bawat
salita at pagkatapos ay makita -
na kasama ng permutations -
kung alin ang may pinakamataas na posibilidad.
>> Plus, maaari mo ring tumingin sa hindi lamang mga salita ngunit parirala.
sa gayon ay maaari mong mapag-aralan ang mga pakikipag-ugnayan sa pagitan ng ang mga salita at pagkatapos ay kumuha ng isang
mas mahusay na pagsasalin.
Gayundin ibang bagay, kaya ito semestre Talaga ako paggawa ng pananaliksik sa
Tsino-Ingles pagsasalin ng computer, kaya isinasalin mula sa
Tsino sa Ingles.
>> At isang bagay ang ginagawa namin ay, bukod sa paggamit isang statistical modelo, na kung saan ay lamang
nakikita ang probabilities na makakita ang ilang mga posisyon sa isang pangungusap, ako
talaga din ang pagdaragdag ng ilang mga syntax sa aking modelo, na sinasabi, oh, kung makikita ko ang uri na ito
ng pagbuo, ito ang gusto ko upang baguhin ito sa kapag isalin ko.
Kaya maaari mo ring idagdag ang ilang mga uri ng elemento ng syntax upang gumawa ng mga
pagsasalin sa mas mahusay na at mas tumpak na.
OK.
>> Kaya kung paano mo makapagsimula, kung nais mong upang gawin ang isang bagay sa computational
aghamwika?
>> Una, pumili ka ng isang proyekto na nagsasangkot ng mga wika.
Kaya, mayroong maraming mga out doon.
Mayroong kaya maraming mga bagay na maaari mong gawin.
At pagkatapos ay maaari mag-isip ng isang modelo na maaari mong gamitin.
Karaniwan ay nangangahulugan na pag-iisip ng pagpapalagay, bilang tulad, oh, kapag ako ay
tulad ng pag-iisip ng mga lyrics.
Ako ay tulad ng, na rin, kapag gusto kong malaman out isang sino ay sumulat na ito, malamang na gusto ko
upang tingnan ang mga salita na ginamit sa tao at makita kung sino ay gumagamit na salita napakadalas.
Kaya subukan na gumawa ng mga palagay at subukang mag-isip ng mga modelo.
At pagkatapos maaari ka ring maghanap online para sa ang uri ng problema na mayroon ka,
at ito ay pagpunta sa iminumungkahi sa iyo na mga modelo na siguro
imo-modelo bagay na rin.
>> At din maaari mong laging-email sa akin.
me@lfreitas.com.
At maaari ko lang sagutin ang iyong mga tanong.
Maaari naming kahit na maaaring makipagkita sa gayon maaari ko bigyan ng mga mungkahi sa mga paraan ng
pagpapatupad ng iyong proyekto.
At ibig sabihin ko kung ikaw ay makakuha kasangkot sa computational aghamwika, ito ay pagpunta
upang maging mahusay.
Ikaw ay pagpunta upang makita doon ay kaya magkano ang mga potensyal na.
At ang industriya ay nais na pag-upa sa iyo kaya masama dahil sa na.
Kaya Umaasa ako mo guys tangkilikin ito.
Kung ikaw guys ay may anumang mga katanungan, maaari mong hilingin sa akin pagkatapos na ito.
Ngunit salamat sa iyo.