ટૂંકો જવાબ: ફાઉન્ડેશન મોડેલ્સ એ મોટા, સામાન્ય હેતુવાળા AI મોડેલ્સ છે જે વિશાળ, વ્યાપક ડેટાસેટ્સ પર તાલીમ પામેલા હોય છે, પછી પ્રોમ્પ્ટિંગ, ફાઇન-ટ્યુનિંગ, ટૂલ્સ અથવા પુનઃપ્રાપ્તિ દ્વારા ઘણા કાર્યો (લેખન, શોધ, કોડિંગ, છબીઓ) માટે અનુકૂળ થાય છે. જો તમને વિશ્વસનીય જવાબોની જરૂર હોય, તો તેમને ઇમ્પ્રુવાઇઝ કરવા દેવાને બદલે, ગ્રાઉન્ડિંગ (જેમ કે RAG), સ્પષ્ટ અવરોધો અને તપાસ સાથે જોડો.
મુખ્ય બાબતો:
વ્યાખ્યા : એક વ્યાપક રીતે પ્રશિક્ષિત બેઝ મોડેલ જેનો ઉપયોગ ઘણા કાર્યોમાં થાય છે, એક-કાર્ય-પ્રતિ-મોડેલ નહીં.
અનુકૂલન : વર્તનને સંચાલિત કરવા માટે પ્રોમ્પ્ટિંગ, ફાઇન-ટ્યુનિંગ, LoRA/એડેપ્ટર્સ, RAG અને ટૂલ્સનો ઉપયોગ કરો.
જનરેટિવ ફિટ : તેઓ ટેક્સ્ટ, છબી, ઑડિઓ, કોડ અને મલ્ટિમોડલ સામગ્રી જનરેશનને શક્તિ આપે છે.
ગુણવત્તા સંકેતો : નિયંત્રણક્ષમતા, ઓછા આભાસ, બહુવિધ ક્ષમતા અને કાર્યક્ષમ અનુમાનને પ્રાથમિકતા આપો.
જોખમ નિયંત્રણો : શાસન અને પરીક્ષણ દ્વારા ભ્રમણા, પૂર્વગ્રહ, ગોપનીયતા લિકેજ અને તાત્કાલિક ઇન્જેક્શન માટે યોજના બનાવો.

આ પછી તમને વાંચવા ગમશે તેવા લેખો:
🔗 AI કંપની શું છે?
AI કંપનીઓ ઉત્પાદનો, ટીમો અને આવક મોડેલ કેવી રીતે બનાવે છે તે સમજો.
🔗 AI કોડ કેવો દેખાય છે?
પાયથોન મોડેલ્સથી API સુધી, AI કોડના ઉદાહરણો જુઓ.
🔗 AI અલ્ગોરિધમ શું છે?
AI અલ્ગોરિધમ્સ શું છે અને તેઓ નિર્ણયો કેવી રીતે લે છે તે જાણો.
🔗 શું છે AI ટેકનોલોજી?
ઓટોમેશન, એનાલિટિક્સ અને બુદ્ધિશાળી એપ્લિકેશનોને શક્તિ આપતી મુખ્ય AI તકનીકોનું અન્વેષણ કરો.
૧) ફાઉન્ડેશન મોડેલ્સ - ધુમ્મસ રહિત વ્યાખ્યા 🧠
ફાઉન્ડેશન મોડેલ એ એક વિશાળ, સામાન્ય હેતુવાળા AI મોડેલ છે જે વ્યાપક ડેટા (સામાન્ય રીતે તે ઘણા બધા) પર તાલીમ પામેલ છે જેથી તેને ફક્ત એક જ નહીં, પણ ઘણા કાર્યોમાં અનુકૂળ કરી શકાય ( NIST , સ્ટેનફોર્ડ CRFM ).
આ માટે અલગ મોડેલ બનાવવાને બદલે:
-
ઇમેઇલ્સ લખવા
-
પ્રશ્નોના જવાબ આપવા
-
PDF નો સારાંશ
-
છબીઓ જનરેટ કરી રહ્યા છીએ
-
સપોર્ટ ટિકિટનું વર્ગીકરણ
-
ભાષાઓનો અનુવાદ
-
કોડ સૂચનો બનાવવા
…તમે એક મોટા બેઝ મોડેલને તાલીમ આપો છો જે "દુનિયા શીખે છે" અસ્પષ્ટ આંકડાકીય રીતે, પછી તમે તેને પ્રોમ્પ્ટ, ફાઇન-ટ્યુનિંગ અથવા વધારાના સાધનો ( બોમ્માસાની એટ અલ., 2021 ) અનુકૂલિત કરો છો
બીજા શબ્દોમાં કહીએ તો: તે એક સામાન્ય એન્જિન જેને તમે ચલાવી શકો છો.
અને હા, કીવર્ડ "જનરલ" છે. બસ આ જ યુક્તિ છે.
૨) જનરેટિવ AI માં ફાઉન્ડેશન મોડેલ્સ શું છે? (તેઓ ખાસ કરીને કેવી રીતે ફિટ થાય છે) 🎨📝
તો, જનરેટિવ AI માં ફાઉન્ડેશન મોડેલ્સ શું છે? તે અંતર્ગત મોડેલ્સ છે જે સિસ્ટમોને પાવર આપે છે જે નવી સામગ્રી - ટેક્સ્ટ, છબીઓ, ઑડિઓ, કોડ, વિડિઓ અને વધુને વધુ ... તે બધાના મિશ્રણ ( NIST , NIST જનરેટિવ AI પ્રોફાઇલ જનરેટ કરી .
જનરેટિવ AI ફક્ત "સ્પામ / સ્પામ નહીં" જેવા લેબલ્સની આગાહી કરવા વિશે નથી. તે એવા આઉટપુટ ઉત્પન્ન કરવા વિશે છે જે કોઈ વ્યક્તિ દ્વારા બનાવવામાં આવ્યા હોય તેવું લાગે છે.
-
ફકરા
-
કવિતાઓ
-
ઉત્પાદન વર્ણનો
-
ચિત્રો
-
મધુર સંગીત
-
એપ્લિકેશન પ્રોટોટાઇપ્સ
-
કૃત્રિમ અવાજો
-
અને ક્યારેક અવિશ્વસનીય રીતે આત્મવિશ્વાસપૂર્ણ બકવાસ 🙃
ફાઉન્ડેશન મોડેલો ખાસ કરીને સારા છે કારણ કે:
-
તેઓએ વિશાળ ડેટાસેટ્સમાંથી વ્યાપક પેટર્નને શોષી લીધા છે ( બોમ્માસાની એટ અલ., 2021 )
-
તેઓ નવા સંકેતો (ઓછામાં ઓછા સંકેતો પણ) ને સામાન્ય બનાવી શકે છે ( બ્રાઉન એટ અલ., 2020 )
-
શરૂઆતથી ફરીથી તાલીમ લીધા વિના ડઝનેક આઉટપુટ માટે તેનો ફરીથી ઉપયોગ કરી શકાય છે ( બોમ્માસાની એટ અલ., 2021 )
તે "બેઝ લેયર" છે - બ્રેડના કણકની જેમ. તમે તેને બેગેટ, પિઝા અથવા સિનામન રોલ્સમાં બેક કરી શકો છો... આ એક સંપૂર્ણ રૂપક નથી, પણ તમે મને સમજી ગયા છો 😄
૩) શા માટે તેમણે બધું બદલી નાખ્યું (અને શા માટે લોકો તેમના વિશે વાત કરવાનું બંધ કરતા નથી) 🚀
ફાઉન્ડેશન મોડેલો પહેલાં, ઘણા બધા AI કાર્ય-વિશિષ્ટ હતા:
-
ભાવના વિશ્લેષણ માટે એક મોડેલ તાલીમ આપો
-
બીજાને અનુવાદ માટે તાલીમ આપો
-
છબી વર્ગીકરણ માટે બીજાને તાલીમ આપો
-
નામવાળી એન્ટિટી ઓળખ માટે બીજાને તાલીમ આપો
તે કામ કર્યું, પણ તે ધીમું, ખર્ચાળ અને થોડું... બરડ હતું.
ફાઉન્ડેશન મોડેલોએ તેને ઉલટાવી દીધું:
-
એકવાર પ્રી-ટ્રેન કરો (મોટો પ્રયાસ)
-
દરેક જગ્યાએ પુનઃઉપયોગ કરો (મોટી ચૂકવણી) ( બોમ્માસાની એટ અલ., 2021 )
તે પુનઃઉપયોગ ગુણાકાર છે. કંપનીઓ 20 વખત વ્હીલ ફરીથી શોધવાને બદલે, એક મોડેલ પરિવારની ટોચ પર 20 સુવિધાઓ બનાવી શકે છે.
ઉપરાંત, વપરાશકર્તા અનુભવ વધુ કુદરતી બન્યો:
-
તમે "ક્લાસિફાયરનો ઉપયોગ" કરતા નથી
-
તમે મોડેલ સાથે એવી રીતે વાત કરો છો જાણે તે કોઈ મદદગાર સહકર્મી હોય જે ક્યારેય ઊંઘતો નથી ☕🤝
ક્યારેક તે એક સહકાર્યકર જેવું પણ હોય છે જે આત્મવિશ્વાસથી બધું જ ગેરસમજ કરે છે, પણ અરે. વૃદ્ધિ.
૪) મુખ્ય વિચાર: પૂર્વ-પ્રશિક્ષણ + અનુકૂલન 🧩
લગભગ બધા ફાઉન્ડેશન મોડેલો એક પેટર્નને અનુસરે છે ( સ્ટેનફોર્ડ CRFM , NIST ):
પ્રી-ટ્રેનિંગ ("ઇન્ટરનેટ-પ્રેમને શોષી લેવાનો" તબક્કો) 📚
આ મોડેલને સ્વ-નિરીક્ષણ શિક્ષણ ( NIST ) નો ઉપયોગ કરીને વિશાળ, વ્યાપક ડેટાસેટ્સ પર તાલીમ આપવામાં આવે છે. ભાષા મોડેલો માટે, તેનો અર્થ સામાન્ય રીતે ગુમ થયેલા શબ્દો અથવા આગામી ટોકનની આગાહી કરવાનો થાય છે ( ડેવલિન એટ અલ., 2018 , બ્રાઉન એટ અલ., 2020 ).
મુદ્દો તેને એક જ કાર્ય શીખવવાનો નથી. મુદ્દો તેને સામાન્ય રજૂઆતો :
-
વ્યાકરણ
-
હકીકતો (પ્રકારની)
-
તર્ક પદ્ધતિઓ (ક્યારેક)
-
લેખન શૈલીઓ
-
કોડ માળખું
-
સામાન્ય માનવીય ઉદ્દેશ્ય
અનુકૂલન ("તેને વ્યવહારુ બનાવો" તબક્કો) 🛠️
પછી તમે તેને એક અથવા વધુનો ઉપયોગ કરીને અનુકૂલિત કરો:
-
સંકેત (સાદી ભાષામાં સૂચનાઓ)
-
સૂચના ટ્યુનિંગ (સૂચનોનું પાલન કરવાની તાલીમ આપવી) ( વેઇ એટ અલ., 2021 )
-
ફાઇન-ટ્યુનિંગ (તમારા ડોમેન ડેટા પર તાલીમ)
-
LoRA / એડેપ્ટર્સ (હળવા વજનના ટ્યુનિંગ પદ્ધતિઓ) ( હુ એટ અલ., 2021 )
-
RAG (પુનઃપ્રાપ્તિ-સંવર્ધિત પેઢી - મોડેલ તમારા દસ્તાવેજોની સલાહ લે છે) ( લુઈસ એટ અલ., 2020 )
-
ટૂલનો ઉપયોગ (કોલિંગ ફંક્શન્સ, આંતરિક સિસ્ટમો બ્રાઉઝ કરવા, વગેરે)
આ જ કારણ છે કે એ જ બેઝ મોડેલ રોમાંસ દ્રશ્ય લખી શકે છે... અને પછી પાંચ સેકન્ડ પછી SQL ક્વેરીને ડીબગ કરવામાં મદદ કરી શકે છે 😭
૫) ફાઉન્ડેશન મોડેલનું સારું વર્ઝન શું બનાવે છે? ✅
આ એ ભાગ છે જેને લોકો છોડી દે છે, અને પછી પસ્તાવો કરે છે.
"સારું" ફાઉન્ડેશન મોડેલ ફક્ત "મોટું" નથી હોતું. મોટું મદદ કરે છે, ખાતરી કરો કે... પણ તે એકમાત્ર વસ્તુ નથી. ફાઉન્ડેશન મોડેલના સારા સંસ્કરણમાં સામાન્ય રીતે આ હોય છે:
મજબૂત સામાન્યીકરણ 🧠
તે કાર્ય-વિશિષ્ટ પુનઃપ્રશિક્ષણની જરૂર વગર ઘણા કાર્યોમાં સારું પ્રદર્શન કરે છે ( બોમ્માસાની એટ અલ., 2021 ).
સ્ટીયરિંગ અને નિયંત્રણક્ષમતા 🎛️
તે વિશ્વસનીય રીતે સૂચનાઓનું પાલન કરી શકે છે જેમ કે:
-
"સંક્ષિપ્ત બનો"
-
"બુલેટ પોઈન્ટનો ઉપયોગ કરો"
-
"મૈત્રીપૂર્ણ સ્વરમાં લખો"
-
"ગુપ્ત માહિતી જાહેર કરશો નહીં"
કેટલાક મોડેલ સ્માર્ટ હોય છે પણ લપસણા હોય છે. જેમ કે શાવરમાં સાબુનો ટુકડો પકડવાનો પ્રયાસ કરવો. મદદરૂપ, પણ અનિયમિત 😅
ઓછી ભ્રામકતા વૃત્તિ (અથવા ઓછામાં ઓછી સ્પષ્ટ અનિશ્ચિતતા) 🧯
કોઈ પણ મોડેલ આભાસથી મુક્ત નથી, પરંતુ સારા મોડેલો:
-
ઓછી ભ્રમણા કરો
-
અનિશ્ચિતતાને વધુ વખત સ્વીકારો
-
પુનઃપ્રાપ્તિનો ઉપયોગ કરતી વખતે પૂરા પાડવામાં આવેલા સંદર્ભની નજીક રહો ( જી એટ અલ., 2023 , લેવિસ એટ અલ., 2020 )
સારી મલ્ટિમોડલ ક્ષમતા (જ્યારે જરૂર હોય ત્યારે) 🖼️🎧
જો તમે એવા સહાયકો બનાવી રહ્યા છો જે છબીઓ વાંચે છે, ચાર્ટનું અર્થઘટન કરે છે અથવા ઑડિઓ સમજે છે, તો મલ્ટિમોડલ ખૂબ જ મહત્વપૂર્ણ છે ( રેડફોર્ડ એટ અલ., 2021 ).
કાર્યક્ષમ અનુમાન ⚡
વિલંબ અને ખર્ચ મહત્વનો છે. એક મોડેલ જે મજબૂત છે પણ ધીમું છે તે ફ્લેટ ટાયરવાળી સ્પોર્ટ્સ કાર જેવું છે.
સલામતી અને ગોઠવણી વર્તન 🧩
ફક્ત "બધું જ નકારો" નહીં, પણ:
-
હાનિકારક સૂચનાઓ ટાળો
-
પક્ષપાત ઘટાડો
-
સંવેદનશીલ વિષયોને કાળજીપૂર્વક હેન્ડલ કરો
-
મૂળભૂત જેલબ્રેક પ્રયાસોનો પ્રતિકાર કરો (કંઈક અંશે...) ( NIST AI RMF 1.0 , NIST જનરેટિવ AI પ્રોફાઇલ )
દસ્તાવેજીકરણ + ઇકોસિસ્ટમ 🌱
આ વાત સૂકી લાગે છે, પણ સાચી છે:
-
સાધનો
-
ઇવલ હાર્નેસ
-
ડિપ્લોયમેન્ટ વિકલ્પો
-
એન્ટરપ્રાઇઝ નિયંત્રણો
-
ફાઇન-ટ્યુનિંગ સપોર્ટ
હા, "ઇકોસિસ્ટમ" એક અસ્પષ્ટ શબ્દ છે. મને પણ તે ગમતો નથી. પણ તે મહત્વનું છે.
૬) સરખામણી કોષ્ટક - સામાન્ય ફાઉન્ડેશન મોડેલ વિકલ્પો (અને તે શેના માટે સારા છે) 🧾
નીચે એક વ્યવહારુ, થોડું અપૂર્ણ સરખામણી કોષ્ટક છે. તે "એકમાત્ર સાચી યાદી" નથી, તે વધુ એવું છે: લોકો જંગલમાં શું પસંદ કરે છે.
| સાધન / મોડેલ પ્રકાર | પ્રેક્ષકો | ભાવ-ભાવવાળું | તે કેમ કામ કરે છે? |
|---|---|---|---|
| માલિકીનું LLM (ચેટ-શૈલી) | ઝડપ + પોલિશ ઇચ્છતી ટીમો | ઉપયોગ-આધારિત / સબ્સ્ક્રિપ્શન | ઉત્તમ સૂચનાઓનું પાલન, મજબૂત સામાન્ય પ્રદર્શન, સામાન્ય રીતે શ્રેષ્ઠ "આઉટ ઓફ બોક્સ" 😌 |
| ઓપન-વેઇટ LLM (સ્વ-હોસ્ટેબલ) | નિયંત્રણ ઇચ્છતા બિલ્ડરો | ઇન્ફ્રાસ્ટ્રક્ચર ખર્ચ (અને માથાનો દુખાવો) | કસ્ટમાઇઝ કરી શકાય તેવું, ગોપનીયતા-મૈત્રીપૂર્ણ, સ્થાનિક રીતે ચાલી શકે છે... જો તમને મધ્યરાત્રિએ ટિંકરિંગ ગમે છે |
| ડિફ્યુઝન ઇમેજ જનરેટર | સર્જનાત્મક, ડિઝાઇન ટીમો | મફતથી ચૂકવેલ | ઉત્તમ છબી સંશ્લેષણ, શૈલીની વિવિધતા, પુનરાવર્તિત કાર્યપ્રવાહ (પણ: આંગળીઓ બંધ હોઈ શકે છે) ✋😬 ( હો એટ અલ., 2020 , રોમ્બાચ એટ અલ., 2021 ) |
| મલ્ટિમોડલ "દ્રષ્ટિ-ભાષા" મોડેલ | છબીઓ + ટેક્સ્ટ વાંચતી એપ્લિકેશનો | ઉપયોગ-આધારિત | તમને છબીઓ, સ્ક્રીનશોટ, આકૃતિઓ વિશે પ્રશ્નો પૂછવા દે છે - આશ્ચર્યજનક રીતે ઉપયોગી ( રેડફોર્ડ એટ અલ., 2021 ) |
| એમ્બેડિંગ ફાઉન્ડેશન મોડેલ | શોધ + RAG સિસ્ટમ્સ | કોલ દીઠ ઓછી કિંમત | સિમેન્ટીક શોધ, ક્લસ્ટરિંગ, ભલામણ માટે ટેક્સ્ટને વેક્ટરમાં ફેરવે છે - શાંત MVP ઊર્જા ( કાર્પુખિન એટ અલ., 2020 , ડુઝ એટ અલ., 2024 ) |
| સ્પીચ-ટુ-ટેક્સ્ટ ફાઉન્ડેશન મોડેલ | કોલ સેન્ટરો, સર્જકો | ઉપયોગ-આધારિત / સ્થાનિક | ઝડપી ટ્રાન્સક્રિપ્શન, બહુભાષી સપોર્ટ, ઘોંઘાટીયા અવાજ માટે પૂરતું સારું (સામાન્ય રીતે) 🎙️ ( વ્હીસ્પર ) |
| ટેક્સ્ટ-ટુ-સ્પીચ ફાઉન્ડેશન મોડેલ | ઉત્પાદન ટીમો, મીડિયા | ઉપયોગ-આધારિત | કુદરતી અવાજનું નિર્માણ, અવાજ શૈલીઓ, વર્ણન - ભયાનક-વાસ્તવિક બની શકે છે ( શેન એટ અલ., 2017 ) |
| કોડ-કેન્દ્રિત LLM | વિકાસકર્તાઓ | ઉપયોગ-આધારિત / સબ્સ્ક્રિપ્શન | કોડ પેટર્ન, ડિબગીંગ, રિફેક્ટરમાં વધુ સારું... છતાં પણ માઇન્ડ-રીડર નથી 😅 |
નોંધ લો કે "ફાઉન્ડેશન મોડેલ" નો અર્થ ફક્ત "ચેટબોટ" નથી. એમ્બેડિંગ્સ અને સ્પીચ મોડેલ્સ પણ પાયા જેવા હોઈ શકે છે, કારણ કે તે વ્યાપક છે અને કાર્યોમાં ફરીથી વાપરી શકાય છે ( બોમ્માસાની એટ અલ., 2021 , NIST ).
૭) નજીકથી નજર: ભાષા ફાઉન્ડેશન મોડેલો કેવી રીતે શીખે છે (વાઇબ વર્ઝન) 🧠🧃
ભાષા પાયાના મોડેલો (જેને ઘણીવાર LLM કહેવામાં આવે છે) સામાન્ય રીતે ટેક્સ્ટના વિશાળ સંગ્રહ પર તાલીમ આપવામાં આવે છે. તેઓ ટોકન્સની આગાહી કરીને શીખે છે ( બ્રાઉન એટ અલ., 2020 ). બસ. કોઈ ગુપ્ત પરી ધૂળ નથી.
પરંતુ જાદુ એ છે કે ટોકન્સની આગાહી કરવાથી મોડેલને માળખું ( CSET ) શીખવાની ફરજ પડે છે:
-
વ્યાકરણ અને વાક્યરચના
-
વિષય સંબંધો
-
તર્ક જેવી પેટર્ન (ક્યારેક)
-
વિચારોના સામાન્ય ક્રમ
-
લોકો કેવી રીતે વસ્તુઓ સમજાવે છે, દલીલ કરે છે, માફી માંગે છે, વાટાઘાટો કરે છે, શીખવે છે
તે માનવીની જેમ "સમજ્યા" વિના લાખો વાતચીતોનું અનુકરણ કરવાનું શીખવા જેવું છે. જે એવું લાગે છે કે તે કામ ન કરવું જોઈએ... અને છતાં તે કામ કરતું રહે છે.
એક હળવું અતિશયોક્તિ: તે મૂળભૂત રીતે માનવ લેખનને એક વિશાળ સંભાવના મગજમાં સંકુચિત કરવા જેવું છે.
પછી ફરીથી, તે રૂપક થોડું શાપિત છે. પણ આપણે આગળ વધીએ છીએ 😄
૮) નજીકથી નજર: પ્રસાર મોડેલો (છબીઓ અલગ રીતે કેમ કામ કરે છે) 🎨🌀
ઇમેજ ફાઉન્ડેશન મોડેલો ઘણીવાર પ્રસાર પદ્ધતિઓનો ઉપયોગ કરે છે ( હો એટ અલ., 2020 , રોમ્બાચ એટ અલ., 2021 ).
કઠોર વિચાર:
-
છબીઓમાં અવાજ ઉમેરો જ્યાં સુધી તે મૂળભૂત રીતે ટીવી સ્થિર ન થાય
-
એક મોડેલને તે અવાજને તબક્કાવાર ઉલટાવી દેવા માટે તાલીમ આપો
-
પેઢી સમયે, અવાજથી શરૂઆત કરો અને પ્રોમ્પ્ટ દ્વારા નિર્દેશિત છબીમાં "નિષ્ક્રિય" થાઓ ( હો એટ અલ., 2020 )
આ જ કારણ છે કે છબી જનરેશન એક ફોટો "વિકાસ" કરવા જેવું લાગે છે, સિવાય કે ફોટો સુપરમાર્કેટના પાંખમાં સ્નીકર્સ પહેરેલા ડ્રેગનનો છે 🛒🐉
ડિફ્યુઝન મોડેલ સારા છે કારણ કે:
-
તેઓ ઉચ્ચ ગુણવત્તાવાળા દ્રશ્યો ઉત્પન્ન કરે છે
-
તેમને ટેક્સ્ટ દ્વારા મજબૂત રીતે માર્ગદર્શન આપી શકાય છે
-
તેઓ પુનરાવર્તિત શુદ્ધિકરણ (ભિન્નતા, ઇનપેઇન્ટિંગ, અપસ્કેલિંગ) ને સમર્થન આપે છે ( રોમ્બાક એટ અલ., 2021 )
તેઓ ક્યારેક આની સાથે પણ સંઘર્ષ કરે છે:
-
છબીઓની અંદર ટેક્સ્ટ રેન્ડરિંગ
-
સુંદર શરીરરચના વિગતો
-
દ્રશ્યોમાં સુસંગત પાત્ર ઓળખ (તે સુધરી રહી છે, પરંતુ હજુ પણ)
9) નજીકથી નજર: મલ્ટિમોડલ ફાઉન્ડેશન મોડેલ્સ (ટેક્સ્ટ + છબીઓ + ઑડિઓ) 👀🎧📝
મલ્ટિમોડલ ફાઉન્ડેશન મોડેલ્સનો હેતુ બહુવિધ ડેટા પ્રકારોને સમજવા અને જનરેટ કરવાનો છે:
-
ટેક્સ્ટ
-
છબીઓ
-
ઑડિઓ
-
વિડિઓ
-
ક્યારેક સેન્સર જેવા ઇનપુટ્સ ( NIST જનરેટિવ AI પ્રોફાઇલ )
વાસ્તવિક જીવનમાં આ કેમ મહત્વનું છે:
-
ગ્રાહક સપોર્ટ સ્ક્રીનશોટનું અર્થઘટન કરી શકે છે
-
સુલભતા સાધનો છબીઓનું વર્ણન કરી શકે છે
-
શિક્ષણ એપ્લિકેશનો આકૃતિઓ સમજાવી શકે છે
-
સર્જકો ફોર્મેટને ઝડપથી રિમિક્સ કરી શકે છે
-
બિઝનેસ ટૂલ્સ ડેશબોર્ડ સ્ક્રીનશોટ "વાંચી" શકે છે અને તેનો સારાંશ આપી શકે છે
હૂડ હેઠળ, મલ્ટિમોડલ સિસ્ટમ્સ ઘણીવાર રજૂઆતોને ગોઠવે છે:
-
છબીને એમ્બેડિંગમાં ફેરવો
-
ટેક્સ્ટને એમ્બેડિંગમાં ફેરવો
-
એવી શેર કરેલી જગ્યા શીખો જ્યાં "બિલાડી" બિલાડીના પિક્સેલ સાથે મેળ ખાય 😺 ( રેડફોર્ડ અને અન્ય, 2021 )
તે હંમેશા ભવ્ય હોતું નથી. ક્યારેક તે રજાઇની જેમ એકસાથે સીવેલું હોય છે. પણ તે કામ કરે છે.
૧૦) ફાઇન-ટ્યુનિંગ વિરુદ્ધ પ્રોમ્પ્ટિંગ વિરુદ્ધ RAG (તમે બેઝ મોડેલને કેવી રીતે અનુકૂલિત કરો છો) 🧰
જો તમે કોઈ ચોક્કસ ક્ષેત્ર (કાનૂની, તબીબી, ગ્રાહક સેવા, આંતરિક જ્ઞાન) માટે ફાઉન્ડેશન મોડેલને વ્યવહારુ બનાવવાનો પ્રયાસ કરી રહ્યા છો, તો તમારી પાસે થોડા લિવર છે:
પ્રોત્સાહન 🗣️
સૌથી ઝડપી અને સરળ.
-
ગુણ: શૂન્ય તાલીમ, ત્વરિત પુનરાવર્તન
-
ગેરફાયદા: અસંગત હોઈ શકે છે, સંદર્ભ મર્યાદાઓ, તાત્કાલિક નાજુકતા
ફાઇન-ટ્યુનિંગ 🎯
તમારા ઉદાહરણો પર મોડેલને વધુ તાલીમ આપો.
-
ગુણ: વધુ સુસંગત વર્તન, સારી ડોમેન ભાષા, પ્રોમ્પ્ટ લંબાઈ ઘટાડી શકે છે
-
ગેરફાયદા: કિંમત, ડેટા ગુણવત્તા જરૂરિયાતો, ઓવરફિટિંગનું જોખમ, જાળવણી
લાઇટવેઇટ ટ્યુનિંગ (LoRA / એડેપ્ટર) 🧩
ફાઇન-ટ્યુનિંગનું વધુ કાર્યક્ષમ સંસ્કરણ ( હુ એટ અલ., 2021 ).
-
ફાયદા: સસ્તું, મોડ્યુલર, સ્વેપ કરવામાં સરળ
-
ગેરફાયદા: હજુ પણ તાલીમ પાઇપલાઇન અને મૂલ્યાંકનની જરૂર છે
RAG (પુનઃપ્રાપ્તિ-સંવર્ધિત પેઢી) 🔎
આ મોડેલ તમારા જ્ઞાન આધાર અને જવાબોમાંથી સંબંધિત દસ્તાવેજો મેળવે છે ( લુઈસ એટ અલ., 2020 ).
-
ગુણ: અદ્યતન જ્ઞાન, આંતરિક રીતે ટાંકણા (જો તમે તેનો અમલ કરો છો), ઓછી પુનઃપ્રશિક્ષણ
-
ગેરફાયદા: પુનઃપ્રાપ્તિ ગુણવત્તા તેને બનાવી અથવા તોડી શકે છે, સારા ચંકિંગ + એમ્બેડિંગની જરૂર છે
સાચી વાત: ઘણી બધી સફળ સિસ્ટમો પ્રોમ્પ્ટિંગ + RAG નું સંયોજન કરે છે. ફાઇન-ટ્યુનિંગ શક્તિશાળી છે, પરંતુ હંમેશા જરૂરી નથી. લોકો તેમાં ખૂબ ઝડપથી જોડાય છે કારણ કે તે પ્રભાવશાળી લાગે છે 😅
૧૧) જોખમો, મર્યાદાઓ અને "કૃપા કરીને આનો આંધળો ઉપયોગ ન કરો" વિભાગ 🧯😬
ફાઉન્ડેશન મોડેલો શક્તિશાળી હોય છે, પરંતુ તે પરંપરાગત સોફ્ટવેરની જેમ સ્થિર નથી હોતા. તેઓ વધુ જેવા છે... આત્મવિશ્વાસની સમસ્યાવાળા પ્રતિભાશાળી ઇન્ટર્ન.
આયોજન કરવા માટેની મુખ્ય મર્યાદાઓ:
ભ્રમ 🌀
મોડેલો શોધ કરી શકે છે:
-
ખોટા સ્ત્રોતો
-
ખોટા તથ્યો
-
બુદ્ધિગમ્ય પણ ખોટા પગલાં ( જી એટ અલ., 2023 )
શમન:
-
ગ્રાઉન્ડેડ સંદર્ભ સાથે RAG ( લુઈસ એટ અલ., 2020 )
-
મર્યાદિત આઉટપુટ (સ્કીમા, ટૂલ કોલ્સ)
-
સ્પષ્ટ "અનુમાન ના કરો" સૂચના
-
ચકાસણી સ્તરો (નિયમો, ક્રોસ-ચેક, માનવ સમીક્ષા)
પૂર્વગ્રહ અને હાનિકારક રીતો ⚠️
તાલીમ ડેટા માનવોને પ્રતિબિંબિત કરે છે, તેથી તમે મેળવી શકો છો:
-
સ્ટીરિયોટાઇપ્સ
-
જૂથોમાં અસમાન પ્રદર્શન
-
અસુરક્ષિત પૂર્ણતાઓ ( NIST AI RMF 1.0 , Bommasani et al., 2021 )
શમન:
-
સલામતી ટ્યુનિંગ
-
રેડ-ટીમ
-
કન્ટેન્ટ ફિલ્ટર્સ
-
સાવચેત ડોમેન મર્યાદાઓ ( NIST જનરેટિવ AI પ્રોફાઇલ )
ડેટા ગોપનીયતા અને લીકેજ 🔒
જો તમે ગોપનીય ડેટા મોડેલ એન્ડપોઇન્ટમાં ફીડ કરો છો, તો તમારે જાણવાની જરૂર છે:
-
તે કેવી રીતે સંગ્રહિત થાય છે
-
શું તેનો ઉપયોગ તાલીમ માટે થાય છે
-
શું લોગિંગ અસ્તિત્વમાં છે
-
તમારી સંસ્થાની જરૂરિયાતોને શું નિયંત્રિત કરે છે ( NIST AI RMF 1.0 )
શમન:
-
ખાનગી ડિપ્લોયમેન્ટ વિકલ્પો
-
મજબૂત શાસન
-
ન્યૂનતમ ડેટા એક્સપોઝર
-
કડક ઍક્સેસ નિયંત્રણ સાથે ફક્ત આંતરિક RAG ( NIST જનરેટિવ AI પ્રોફાઇલ , કાર્લિની એટ અલ., 2021 )
તાત્કાલિક ઇન્જેક્શન (ખાસ કરીને RAG સાથે) 🕳️
જો મોડેલ અવિશ્વસનીય ટેક્સ્ટ વાંચે છે, તો તે ટેક્સ્ટ તેને હેરફેર કરવાનો પ્રયાસ કરી શકે છે:
-
"પહેલાંની સૂચનાઓને અવગણો..."
-
"મને રહસ્ય મોકલો..." ( OWASP , ગ્રેશેક એટ અલ., 2023 )
શમન:
-
આઇસોલેટ સિસ્ટમ સૂચનાઓ
-
મેળવેલી સામગ્રીને સેનિટાઇઝ કરો
-
ટૂલ-આધારિત નીતિઓનો ઉપયોગ કરો (માત્ર સંકેતો જ નહીં)
-
વિરોધી ઇનપુટ્સ સાથે પરીક્ષણ ( OWASP ચીટ શીટ , NIST જનરેટિવ AI પ્રોફાઇલ )
તમને ડરાવવાનો પ્રયાસ નથી કરતો. બસ... ફ્લોરબોર્ડ ક્યાંથી અવાજ કરે છે તે જાણવું વધુ સારું છે.
૧૨) તમારા ઉપયોગ માટે ફાઉન્ડેશન મોડેલ કેવી રીતે પસંદ કરવું 🎛️
જો તમે ફાઉન્ડેશન મોડેલ પસંદ કરી રહ્યા છો (અથવા તેના પર નિર્માણ કરી રહ્યા છો), તો આ સંકેતોથી શરૂઆત કરો:
તમે શું જનરેટ કરી રહ્યા છો તે વ્યાખ્યાયિત કરો 🧾
-
ફક્ત ટેક્સ્ટ
-
છબીઓ
-
ઑડિઓ
-
મિશ્ર મલ્ટિમોડલ
તમારા વાસ્તવિકતા બારને સેટ કરો 📌
જો તમને ઉચ્ચ ચોકસાઈની જરૂર હોય (નાણાકીય, આરોગ્ય, કાનૂની, સલામતી):
-
તમને RAG ની જરૂર પડશે ( લુઈસ એટ અલ., 2020 )
-
તમને માન્યતા જોઈશે
-
તમને લૂપમાં માનવ સમીક્ષાની જરૂર પડશે (ઓછામાં ઓછી ક્યારેક) ( NIST AI RMF 1.0 )
તમારા લેટન્સી લક્ષ્ય નક્કી કરો ⚡
ચેટ તાત્કાલિક છે. બેચ સારાંશ ધીમો પડી શકે છે.
જો તમને તાત્કાલિક પ્રતિસાદની જરૂર હોય, તો મોડેલનું કદ અને હોસ્ટિંગ મહત્વપૂર્ણ છે.
નકશાની ગોપનીયતા અને પાલનની જરૂરિયાતો 🔐
કેટલીક ટીમોને જરૂર છે:
-
ઓન-પ્રેમ / VPC ડિપ્લોયમેન્ટ
-
કોઈ ડેટા રીટેન્શન નથી
-
કડક ઓડિટ લોગ
-
પ્રતિ દસ્તાવેજ ઍક્સેસ નિયંત્રણ ( NIST AI RMF 1.0 , NIST જનરેટિવ AI પ્રોફાઇલ )
બજેટ સંતુલિત કરો - અને ઓપરેશન્સ ધીરજ રાખો 😅
સ્વ-હોસ્ટિંગ નિયંત્રણ આપે છે પરંતુ જટિલતા ઉમેરે છે.
મેનેજ્ડ API સરળ છે પરંતુ મોંઘા અને ઓછા કસ્ટમાઇઝ કરી શકાય તેવા હોઈ શકે છે.
એક નાની વ્યવહારુ ટિપ: પહેલા કંઈક સરળ સાથે પ્રોટોટાઇપ બનાવો, પછી પછી સખત બનાવો. "પરફેક્ટ" સેટઅપથી શરૂઆત કરવાથી સામાન્ય રીતે બધું ધીમું પડી જાય છે.
૧૩) જનરેટિવ AI માં ફાઉન્ડેશન મોડેલ્સ શું છે? (ઝડપી માનસિક મોડેલ) 🧠✨
ચાલો તેને પાછું લાવીએ. જનરેટિવ AI માં ફાઉન્ડેશન મોડેલ્સ શું છે?
તેઓ છે:
-
વ્યાપક ડેટા પર તાલીમ પામેલા મોટા, સામાન્ય મોડેલો ( NIST , સ્ટેનફોર્ડ CRFM )
-
સામગ્રી (ટેક્સ્ટ, છબીઓ, ઑડિઓ, વગેરે) જનરેટ કરવામાં સક્ષમ ( NIST જનરેટિવ AI પ્રોફાઇલ )
-
પ્રોમ્પ્ટ, ફાઇન-ટ્યુનિંગ અને પુનઃપ્રાપ્તિ દ્વારા ઘણા કાર્યો માટે અનુકૂલનશીલ ( બોમ્માસાની એટ અલ., 2021 )
-
મોટાભાગના આધુનિક જનરેટિવ AI ઉત્પાદનોને શક્તિ આપતું બેઝ લેયર
તે કોઈ એક આર્કિટેક્ચર કે બ્રાન્ડ નથી. તે મોડેલ્સની એક શ્રેણી છે જે એક પ્લેટફોર્મની જેમ વર્તે છે.
ફાઉન્ડેશન મોડેલ કેલ્ક્યુલેટર જેવું ઓછું અને રસોડું જેવું વધુ હોય છે. તમે તેમાં ઘણું બધું રાંધી શકો છો. જો તમે ધ્યાન ન આપો તો તમે ટોસ્ટ પણ બાળી શકો છો… પરંતુ રસોડું હજુ પણ ખૂબ જ ઉપયોગી છે 🍳🔥
૧૪) રીકેપ અને ટેકઅવે ✅🙂
ફાઉન્ડેશન મોડેલ્સ જનરેટિવ AI ના ફરીથી વાપરી શકાય તેવા એન્જિન છે. તેમને વ્યાપક રીતે તાલીમ આપવામાં આવે છે, પછી પ્રોમ્પ્ટિંગ, ફાઇન-ટ્યુનિંગ અને રીટ્રીવલ ( NIST , સ્ટેનફોર્ડ CRFM ) દ્વારા ચોક્કસ કાર્યો માટે અનુકૂળ કરવામાં આવે છે. તેઓ અદ્ભુત, અસ્વચ્છ, શક્તિશાળી અને ક્યારેક ક્યારેક હાસ્યાસ્પદ હોઈ શકે છે - બધા એકસાથે.
રીકેપ:
-
ફાઉન્ડેશન મોડેલ = સામાન્ય હેતુનું બેઝ મોડેલ ( NIST )
-
જનરેટિવ AI = સામગ્રી બનાવટ, માત્ર વર્ગીકરણ નહીં ( NIST જનરેટિવ AI પ્રોફાઇલ )
-
અનુકૂલન પદ્ધતિઓ (પ્રોમ્પટિંગ, આરએજી, ટ્યુનિંગ) તેને વ્યવહારુ બનાવે છે ( લુઈસ એટ અલ., 2020 , હુ એટ અલ., 2021 )
-
મોડેલ પસંદ કરવું એ ટ્રેડઓફ વિશે છે: ચોકસાઈ, કિંમત, વિલંબતા, ગોપનીયતા, સલામતી ( NIST AI RMF 1.0 )
જો તમે જનરેટિવ AI વડે કંઈપણ બનાવી રહ્યા છો, તો ફાઉન્ડેશન મોડેલ્સને સમજવું વૈકલ્પિક નથી. વાત એ છે કે આખો ફ્લોર જેના પર ઇમારત ઉભી છે... અને હા, ક્યારેક ફ્લોર થોડો ધ્રુજી જાય છે 😅
વારંવાર પૂછાતા પ્રશ્નો
ફાઉન્ડેશન મોડેલ્સ, સરળ શબ્દોમાં
ફાઉન્ડેશન મોડેલ એ એક વિશાળ, સામાન્ય હેતુવાળા AI મોડેલ છે જે વ્યાપક ડેટા પર તાલીમ પામેલ છે જેથી તેનો ઉપયોગ ઘણા કાર્યો માટે ફરીથી થઈ શકે. દરેક કાર્ય માટે એક મોડેલ બનાવવાને બદલે, તમે એક મજબૂત "બેઝ" મોડેલથી શરૂઆત કરો અને જરૂર મુજબ તેને અનુકૂલિત કરો. તે અનુકૂલન ઘણીવાર પ્રોમ્પ્ટિંગ, ફાઇન-ટ્યુનિંગ, રીટ્રીવલ (RAG) અથવા ટૂલ્સ દ્વારા થાય છે. મુખ્ય વિચાર પહોળાઈ અને સ્ટીઅરેબિલિટી છે.
પરંપરાગત કાર્ય-વિશિષ્ટ AI મોડેલોથી ફાઉન્ડેશન મોડેલ કેવી રીતે અલગ પડે છે
પરંપરાગત AI ઘણીવાર દરેક કાર્ય માટે એક અલગ મોડેલ તાલીમ આપે છે, જેમ કે સેન્ટિમેન્ટ વિશ્લેષણ અથવા અનુવાદ. ફાઉન્ડેશન મોડેલો તે પેટર્નને ઉલટાવે છે: એકવાર પ્રીટ્રેન કરો, પછી ઘણી સુવિધાઓ અને ઉત્પાદનોમાં ફરીથી ઉપયોગ કરો. આ ડુપ્લિકેટ પ્રયત્નોને ઘટાડી શકે છે અને નવી ક્ષમતાઓના વિતરણને ઝડપી બનાવી શકે છે. ટ્રેડઓફ એ છે કે જ્યાં સુધી તમે અવરોધો અને પરીક્ષણ ઉમેરશો નહીં ત્યાં સુધી તેઓ ક્લાસિક સોફ્ટવેર કરતાં ઓછા અનુમાનિત હોઈ શકે છે.
જનરેટિવ AI માં ફાઉન્ડેશન મોડેલ્સ
જનરેટિવ AI માં, ફાઉન્ડેશન મોડેલ્સ એ બેઝ સિસ્ટમ્સ છે જે ટેક્સ્ટ, છબીઓ, ઑડિઓ, કોડ અથવા મલ્ટિમોડલ આઉટપુટ જેવી નવી સામગ્રી ઉત્પન્ન કરી શકે છે. તેઓ લેબલિંગ અથવા વર્ગીકરણ સુધી મર્યાદિત નથી; તેઓ માનવ-નિર્મિત કાર્ય જેવા પ્રતિભાવો ઉત્પન્ન કરે છે. કારણ કે તેઓ પ્રીટ્રેનિંગ દરમિયાન વ્યાપક પેટર્ન શીખે છે, તેઓ ઘણા પ્રોમ્પ્ટ પ્રકારો અને ફોર્મેટ્સને હેન્ડલ કરી શકે છે. તેઓ મોટાભાગના આધુનિક જનરેટિવ અનુભવો પાછળ "બેઝ લેયર" છે.
પ્રીટ્રેનિંગ દરમિયાન ફાઉન્ડેશન મોડેલ્સ કેવી રીતે શીખે છે
મોટાભાગના ભાષા પાયાના મોડેલો આગળના શબ્દ અથવા ટેક્સ્ટમાં ગુમ થયેલા શબ્દો જેવા સંકેતોની આગાહી કરીને શીખે છે. તે સરળ ઉદ્દેશ્ય તેમને વ્યાકરણ, શૈલી અને સમજૂતીના સામાન્ય દાખલાઓ જેવી રચનાને આંતરિક બનાવવા માટે દબાણ કરે છે. તેઓ વિશ્વ જ્ઞાનનો મોટો ભાગ પણ શોષી શકે છે, જોકે હંમેશા વિશ્વસનીય રીતે નહીં. પરિણામ એક મજબૂત સામાન્ય રજૂઆત છે જે તમે પછીથી ચોક્કસ કાર્ય તરફ દોરી શકો છો.
પ્રોમ્પ્ટિંગ, ફાઇન-ટ્યુનિંગ, LoRA અને RAG વચ્ચેનો તફાવત
સૂચનાઓનો ઉપયોગ કરીને વર્તનને નિયંત્રિત કરવાનો સૌથી ઝડપી રસ્તો પ્રોમ્પ્ટિંગ છે, પરંતુ તે નાજુક હોઈ શકે છે. ફાઇન-ટ્યુનિંગ મોડેલને વધુ સુસંગત વર્તન માટે તમારા ઉદાહરણો પર વધુ તાલીમ આપે છે, પરંતુ તે ખર્ચ અને જાળવણી ઉમેરે છે. LoRA/એડેપ્ટર્સ એક હળવો ફાઇન-ટ્યુનિંગ અભિગમ છે જે ઘણીવાર સસ્તો અને વધુ મોડ્યુલર હોય છે. RAG સંબંધિત દસ્તાવેજો મેળવે છે અને તે સંદર્ભનો ઉપયોગ કરીને મોડેલ જવાબ ધરાવે છે, જે તાજગી અને ગ્રાઉન્ડિંગમાં મદદ કરે છે.
ફાઇન-ટ્યુનિંગને બદલે RAG નો ઉપયોગ ક્યારે કરવો
જ્યારે તમને તમારા વર્તમાન દસ્તાવેજો અથવા આંતરિક જ્ઞાન આધાર પર આધારિત જવાબોની જરૂર હોય ત્યારે RAG ઘણીવાર એક મજબૂત પસંદગી હોય છે. તે મોડેલને પેઢીના સમયે સંબંધિત સંદર્ભ પૂરો પાડીને "અનુમાન" ઘટાડી શકે છે. જ્યારે તમને સુસંગત શૈલી, ડોમેન શબ્દસમૂહ અથવા વર્તનની જરૂર હોય ત્યારે ફાઇન-ટ્યુનિંગ વધુ સારી રીતે ફિટ થાય છે જે પ્રોમ્પ્ટિંગ વિશ્વસનીય રીતે ઉત્પન્ન કરી શકતું નથી. ઘણી વ્યવહારુ સિસ્ટમો ફાઇન-ટ્યુનિંગ સુધી પહોંચતા પહેલા પ્રોમ્પ્ટિંગ + RAG ને જોડે છે.
ભ્રમ કેવી રીતે ઘટાડવો અને વધુ વિશ્વસનીય જવાબો કેવી રીતે મેળવશો
એક સામાન્ય અભિગમ એ છે કે મોડેલને રીટ્રીવલ (RAG) સાથે ગ્રાઉન્ડ કરવામાં આવે જેથી તે પૂરા પાડવામાં આવેલા સંદર્ભની નજીક રહે. તમે સ્કીમા સાથે આઉટપુટને પણ મર્યાદિત કરી શકો છો, મુખ્ય પગલાં માટે ટૂલ કોલની જરૂર પાડી શકો છો અને સ્પષ્ટ "અનુમાન ન કરો" સૂચનાઓ ઉમેરી શકો છો. ચકાસણી સ્તરો પણ મહત્વપૂર્ણ છે, જેમ કે નિયમ તપાસ, ક્રોસ-ચેકિંગ અને ઉચ્ચ-હિસ્સાના ઉપયોગના કેસો માટે માનવ સમીક્ષા. મોડેલને સંભવિત સહાયક તરીકે ગણો, મૂળભૂત રીતે સત્યના સ્ત્રોત તરીકે નહીં.
ઉત્પાદનમાં ફાઉન્ડેશન મોડેલ્સ સાથેના સૌથી મોટા જોખમો
સામાન્ય જોખમોમાં ભ્રમણા, તાલીમ ડેટામાંથી પક્ષપાતી અથવા હાનિકારક પેટર્ન અને સંવેદનશીલ ડેટાને નબળી રીતે હેન્ડલ કરવામાં આવે તો ગોપનીયતા લીકેજનો સમાવેશ થાય છે. સિસ્ટમો પ્રોમ્પ્ટ ઇન્જેક્શન માટે પણ સંવેદનશીલ હોઈ શકે છે, ખાસ કરીને જ્યારે મોડેલ દસ્તાવેજો અથવા વેબ સામગ્રીમાંથી અવિશ્વસનીય ટેક્સ્ટ વાંચે છે. શમનમાં સામાન્ય રીતે શાસન, રેડ-ટીમિંગ, ઍક્સેસ નિયંત્રણો, સુરક્ષિત પ્રોમ્પ્ટિંગ પેટર્ન અને માળખાગત મૂલ્યાંકનનો સમાવેશ થાય છે. આ જોખમો માટે પછીથી પેચ કરવાને બદલે વહેલા આયોજન કરો.
ત્વરિત ઇન્જેક્શન અને RAG સિસ્ટમ્સમાં તે શા માટે મહત્વનું છે
પ્રોમ્પ્ટ ઇન્જેક્શન ત્યારે થાય છે જ્યારે અવિશ્વસનીય ટેક્સ્ટ સૂચનાઓને ઓવરરાઇડ કરવાનો પ્રયાસ કરે છે, જેમ કે "પહેલાના દિશાનિર્દેશોને અવગણો" અથવા "રહસ્યો જાહેર કરો". RAG માં, પુનઃપ્રાપ્ત દસ્તાવેજોમાં તે દૂષિત સૂચનાઓ હોઈ શકે છે, અને જો તમે સાવચેત ન રહો તો મોડેલ તેમને અનુસરી શકે છે. એક સામાન્ય અભિગમ એ છે કે સિસ્ટમ સૂચનાઓને અલગ કરવી, પુનઃપ્રાપ્ત સામગ્રીને સેનિટાઇઝ કરવી અને ફક્ત સંકેતો આપવાને બદલે ટૂલ-આધારિત નીતિઓ પર આધાર રાખવો. વિરોધી ઇનપુટ્સ સાથે પરીક્ષણ નબળા સ્થળોને જાહેર કરવામાં મદદ કરે છે.
તમારા ઉપયોગ માટે ફાઉન્ડેશન મોડેલ કેવી રીતે પસંદ કરવું
તમારે શું જનરેટ કરવાની જરૂર છે તે વ્યાખ્યાયિત કરીને શરૂઆત કરો: ટેક્સ્ટ, છબીઓ, ઑડિઓ, કોડ અથવા મલ્ટિમોડલ આઉટપુટ. પછી તમારા વાસ્તવિકતા બારને સેટ કરો - ઉચ્ચ-ચોકસાઈ ડોમેન્સને ઘણીવાર ગ્રાઉન્ડિંગ (RAG), માન્યતા અને ક્યારેક માનવ સમીક્ષાની જરૂર પડે છે. લેટન્સી અને ખર્ચને ધ્યાનમાં લો, કારણ કે એક મજબૂત મોડેલ જે ધીમું અથવા ખર્ચાળ છે તે મોકલવું મુશ્કેલ હોઈ શકે છે. છેલ્લે, નકશા ગોપનીયતા અને પાલન માટે ડિપ્લોયમેન્ટ વિકલ્પો અને નિયંત્રણોની જરૂર છે.
સંદર્ભ
-
નેશનલ ઇન્સ્ટિટ્યૂટ ઓફ સ્ટાન્ડર્ડ્સ એન્ડ ટેકનોલોજી (NIST) - ફાઉન્ડેશન મોડેલ (શબ્દકોષીય શબ્દ) - csrc.nist.gov
-
નેશનલ ઇન્સ્ટિટ્યૂટ ઓફ સ્ટાન્ડર્ડ્સ એન્ડ ટેકનોલોજી (NIST) - NIST AI 600-1: જનરેટિવ AI પ્રોફાઇલ - nvlpubs.nist.gov
-
નેશનલ ઇન્સ્ટિટ્યૂટ ઓફ સ્ટાન્ડર્ડ્સ એન્ડ ટેકનોલોજી (NIST) - NIST AI 100-1: AI રિસ્ક મેનેજમેન્ટ ફ્રેમવર્ક (AI RMF 1.0) - nvlpubs.nist.gov
-
સ્ટેનફોર્ડ સેન્ટર ફોર રિસર્ચ ઓન ફાઉન્ડેશન મોડેલ્સ (CRFM) - રિપોર્ટ - crfm.stanford.edu
-
arXiv - ફાઉન્ડેશન મોડલ્સની તકો અને જોખમો પર (Bommasani et al., 2021) - arxiv.org
-
arXiv - ભાષા મોડેલ્સ ઓછા શીખનારા હોય છે (બ્રાઉન એટ અલ., 2020) - arxiv.org
-
arXiv - જ્ઞાન-સઘન NLP કાર્યો માટે પુનઃપ્રાપ્તિ-સંવર્ધિત પેઢી (લુઈસ એટ અલ., 2020) - arxiv.org
-
arXiv - LoRA: મોટા ભાષા મોડેલોનું નીચા-ક્રમનું અનુકૂલન (હુ એટ અલ., 2021) - arxiv.org
-
arXiv - BERT: ભાષા સમજણ માટે ડીપ બાયડાયરેક્શનલ ટ્રાન્સફોર્મર્સની પૂર્વ-તાલીમ (ડેવલિન એટ અલ., 2018) - arxiv.org
-
arXiv - ફાઇન ટ્યુન્ડ લેંગ્વેજ મોડેલ્સ ઝીરો-શોટ લર્નર્સ છે (વેઇ એટ અલ., 2021) - arxiv.org
-
ACM ડિજિટલ લાઇબ્રેરી - કુદરતી ભાષા પેઢીમાં ભ્રામકતાનો સર્વે (જી એટ અલ., 2023) - dl.acm.org
-
arXiv - કુદરતી ભાષા દેખરેખમાંથી ટ્રાન્સફરેબલ વિઝ્યુઅલ મોડેલ્સ શીખવું (રેડફોર્ડ એટ અલ., 2021) - arxiv.org
-
arXiv - ડિનોઇઝિંગ ડિફ્યુઝન પ્રોબેબિલિસ્ટિક મોડેલ્સ (હો એટ અલ., 2020) - arxiv.org
-
arXiv - સુષુપ્ત પ્રસરણ મોડેલો સાથે ઉચ્ચ-રીઝોલ્યુશન છબી સંશ્લેષણ (રોમ્બાક એટ અલ., 2021) - arxiv.org
-
arXiv - ઓપન-ડોમેન પ્રશ્ન જવાબ માટે ગાઢ માર્ગ પુનઃપ્રાપ્તિ (કાર્પુખિન એટ અલ., 2020) - arxiv.org
-
arXiv - Faiss લાઇબ્રેરી (Douze et al., 2024) - arxiv.org
-
ઓપનએઆઈ - વ્હિસ્પરનો પરિચય - openai.com
-
arXiv - મેલ સ્પેક્ટ્રોગ્રામ આગાહીઓ પર કન્ડીશનીંગ વેવનેટ દ્વારા કુદરતી TTS સંશ્લેષણ (શેન એટ અલ., 2017) - arxiv.org
-
સેન્ટર ફોર સિક્યુરિટી એન્ડ ઇમર્જિંગ ટેકનોલોજી (CSET), જ્યોર્જટાઉન યુનિવર્સિટી - આગામી શબ્દની આગાહીની આશ્ચર્યજનક શક્તિ: મોટા ભાષા મોડેલો સમજાવાયેલ (ભાગ 1) - cset.georgetown.edu
-
USENIX - મોટા ભાષા મોડેલોમાંથી તાલીમ ડેટા કાઢવા (કાર્લિની એટ અલ., 2021) - usenix.org
-
OWASP - LLM01: પ્રોમ્પ્ટ ઇન્જેક્શન - genai.owasp.org
-
arXiv - તમે જે માંગ્યું છે તેના કરતાં વધુ: એપ્લિકેશન-સંકલિત મોટા ભાષા મોડેલો માટે નવલકથા પ્રોમ્પ્ટ ઇન્જેક્શનના જોખમોનું વ્યાપક વિશ્લેષણ (ગ્રીશેક એટ અલ., 2023) - arxiv.org
-
OWASP ચીટ શીટ શ્રેણી - LLM પ્રોમ્પ્ટ ઇન્જેક્શન નિવારણ ચીટ શીટ - cheatsheetseries.owasp.org