Post by arnaorni685 on Nov 11, 2024 1:15:13 GMT -5
pak Google SGE pikeun Digital Enterprise
Sanajan Google SGE teu acan sadia di Uni Éropa, di Level Asasi Manusa urang hayang meunang dihareupeun kaulinan sarta nalungtik ngembangkeun anyar ieu saloba mungkin guna bisa ngabales klien kami ngeunaan dampak eta bisa jadi dina maranéhanana. usaha-usaha. Kami parantos nganalisa ratusan pamilarian sareng di handap ieu kami bagikeun kesan kami: naon Google SGE, naon dampakna kana kabiasaan milarian pangguna, ngeunaan peran Google salaku generator lalu lintas organik anu berkualitas sareng ngeunaan cara urang ngalakukeun SEO. Ieu rada lila, tapi kuring ngingetkeun yén éta patut eta. Dupi anjeun ngiringan abdi?
Google SGE (Search Generative Experience) nyaéta cara anyar pikeun ngaréspon panéangan pamaké ku cara ngagabungkeun kakuatan model basa badag (LLM) kawas chatGPT jeung kamampuhan ngorondang sacara real-time tina mesin pencari kawas Google, pikeun ngaronjatkeun réliabilitas réspon jeung Sebutkeun dokumén anu ngadukung aranjeunna.
Cathy Edwards éta jawab presenting Google SGE salila Google I / O konferensi on 10th Méi sarta nepi ka minggu panungtungan éta ngan sadia on otorisasina prior pikeun ngasupkeun program Google Search Labs di Amérika Serikat, India jeung Jepang. Kusabab 9 Nopémber, kumaha ogé, éta parantos disebarkeun ka 120 nagara, sanaos Kanada sareng Uni Éropa henteu kalebet, sigana kusabab undang-undang anu langkung ketat ngeunaan panyalindungan data sareng pangaturan sistem anu ngagunakeun Artificial Intelligence (AI).
Pikeun ngaksés hasil Google SGE ti nagara anu henteu acan kalebet dina program, anjeun kedah gaduh profil Google anu dioténtikasi nganggo telepon sélulér lokal ti salah sahiji nagara éta sareng kotektak nganggo IP aksés anu konsisten sareng auténtikasi ieu.
Google SGE ngalibatkeun dua konsép konci dina pangwangunanna:
Modél Basa Gedé (LLMs).
Retrieval-Augmented Generation (RAG).
Hayu urang tingali naon aranjeunna diwangun.
Naon model basa badag (LLMs) kawas ChatGPT
Modél Basa Gedé (LLM) mangrupikeun jinis modél intelijen buatan anu dirancang pikeun otomatis ngartos sareng ngahasilkeun basa manusa. Dasarna tiasa dianggo sapertos otak buatan anu ngolah téks anu ageung pikeun diajar pola sareng struktur basa, teras tiasa ngagunakeun pangaweruh éta pikeun ngaduga sareng ngahasilkeun téks énggal.
ChatGPT mangrupikeun jinis LLM khusus anu disebut GPT (Generative Pre-trained Transformer) anu dikembangkeun ku OpenAI. GPT nyaéta modél basa dumasar kana arsitéktur Transformer , mimitina dijieun ku Google, anu ngagunakeun jaringan saraf pikeun ngolah téks nu jumlahna ageung tur diajar kumaha carana ngahasilkeun téks anyar.
Kumaha LLMs Ngalatih sareng Diajar
ChatGPT diajar ku cara nganalisa sareng ngaidentipikasi pola dina set Mésér Cell Phone Nomer Timbal data ageung anu disayogikeun ku pihak katilu atanapi sayogi online sacara umum. Salah sahiji tulisan anu paling ngajelaskeun kumaha intelijen buatan generatif dianggo nyaéta ieu ti Financial Times.
Dataset anu digunakeun pikeun ngalatih GPT 3.5 nyaéta:
Common Crawl nyaéta set data anu dijieun ku organisasi nirlaba anu ngaranna sarua . Common Crawl ngagunakeun bot sareng agén pangguna CCbot / 2.0 pikeun ngorondang eusi online anu tiasa diaksés ku masarakat. CCbot hormat tungtunan diatur kaluar dina file robots.txt ogé dina meta CCbot, maturan cara pikeun meungpeuk Crawling atawa pikeun nyegah eta tina nuturkeuna. Sanajan kitu, blocking CCbot ayeuna lain hartosna yén eusi crawled saméméhna anu geus bagian tina dataset na bakal dihapus. Urang ngan bakal nyegah Crawling tina eusi anyar. Penting pikeun dicatet yén set data sapertos Common Crawl dianggo ku perusahaan pariwara pikeun ngagolongkeun eusi sareng nargétkeun iklan anu muncul dina éta. Ngablokir aksés CCBot tiasa gaduh dampak dina sababaraha jaringan iklan.
WebText2: nyaéta set data milik OpenAI dicandak tina situs wéb anu ngorondang kalayan langkung ti 3 sora dina Reddit, nganggap yén eusi situs ieu tiasa dipercaya sareng kualitas.