ટૂંકો જવાબ: વ્યવહારમાં કામ કરતું AI એજન્ટ બનાવવા માટે, તેને નિયંત્રિત લૂપ તરીકે ગણો: ઇનપુટ લો, આગળની ક્રિયા નક્કી કરો, સંકુચિત અવકાશવાળા ટૂલને કૉલ કરો, પરિણામનું અવલોકન કરો અને સ્પષ્ટ "પૂર્ણ" ચેક પસાર થાય ત્યાં સુધી પુનરાવર્તન કરો. જ્યારે કાર્ય બહુ-પગલાં અને ટૂલ-સંચાલિત હોય ત્યારે તે તેની જાળવણી મેળવે છે; જો એક જ પ્રોમ્પ્ટ તેને ઉકેલે છે, તો એજન્ટને છોડી દો. કડક ટૂલ સ્કીમા, સ્ટેપ લિમિટ, લોગિંગ અને વેલિડેટર/ક્રિટિક ઉમેરો જેથી જ્યારે ટૂલ્સ નિષ્ફળ જાય અથવા ઇનપુટ્સ અસ્પષ્ટ હોય, ત્યારે એજન્ટ લૂપિંગને બદલે આગળ વધે.
મુખ્ય બાબતો:
કંટ્રોલર લૂપ : સ્પષ્ટ સ્ટોપ શરતો અને મહત્તમ પગલાં સાથે ઇનપુટ → ક્રિયા → પુનરાવર્તનનું અવલોકન કરો.
ટૂલ ડિઝાઇન : "કંઈપણ કરો" અંધાધૂંધીને રોકવા માટે ટૂલ્સને સાંકડા, ટાઇપ કરેલા, પરવાનગી આપેલા અને માન્ય રાખો.
મેમરી હાઇજીન : કોમ્પેક્ટ ટૂંકા ગાળાની સ્થિતિ વત્તા લાંબા ગાળાની પુનઃપ્રાપ્તિનો ઉપયોગ કરો; સંપૂર્ણ ટ્રાન્સક્રિપ્ટ ડમ્પ કરવાનું ટાળો.
દુરુપયોગ પ્રતિકાર : જોખમી ક્રિયાઓ માટે મંજૂરી સૂચિ, દર મર્યાદા, અયોગ્યતા અને "ડ્રાય-રન" ઉમેરો.
પરીક્ષણક્ષમતા : એક દૃશ્ય સ્યુટ (નિષ્ફળતાઓ, અસ્પષ્ટતા, ઇન્જેક્શન) જાળવો અને દરેક ફેરફાર પર ફરીથી ચલાવો.

🔗 AI પ્રદર્શન કેવી રીતે માપવું
ગતિ, ચોકસાઈ અને વિશ્વસનીયતાના બેન્ચમાર્ક માટે વ્યવહારુ મેટ્રિક્સ શીખો.
🔗 AI સાથે કેવી રીતે વાત કરવી
વધુ સારા જવાબો મેળવવા માટે સંકેતો, સંદર્ભ અને ફોલો-અપ્સનો ઉપયોગ કરો.
🔗 AI મોડેલ્સનું મૂલ્યાંકન કેવી રીતે કરવું
પરીક્ષણો, રૂબ્રિક્સ અને વાસ્તવિક દુનિયાના કાર્ય પરિણામોનો ઉપયોગ કરીને મોડેલોની તુલના કરો.
🔗 AI મોડેલ્સને કેવી રીતે ઑપ્ટિમાઇઝ કરવા
ટ્યુનિંગ, કાપણી અને દેખરેખ દ્વારા ગુણવત્તા અને ખર્ચમાં સુધારો કરો.
૧) સામાન્ય વ્યક્તિની દ્રષ્ટિએ, AI એજન્ટ શું છે 🧠
એઆઈ એજન્ટ એક લૂપ છે. લેંગચેન “એજન્ટ્સ” દસ્તાવેજો
બસ, બસ. મધ્યમાં મગજ ધરાવતો લૂપ.
ઇનપુટ → વિચારો → કાર્ય → અવલોકન → પુનરાવર્તન કરો . રીએક્ટ પેપર (કારણ + કાર્ય)
ક્યાં:
-
ઇનપુટ એ વપરાશકર્તા વિનંતી અથવા ઇવેન્ટ (નવી ઇમેઇલ, સપોર્ટ ટિકિટ, સેન્સર પિંગ) છે.
-
વિચાર એ એક ભાષા મોડેલ છે જે આગળના પગલા વિશે તર્ક આપે છે.
-
એક્ટ એક ટૂલને કૉલ કરી રહ્યું છે (આંતરિક દસ્તાવેજો શોધો, કોડ ચલાવો, ટિકિટ બનાવો, જવાબ ડ્રાફ્ટ કરો). OpenAI ફંક્શન કૉલિંગ માર્ગદર્શિકા
-
ઓબ્ઝર્વ ટૂલ આઉટપુટ વાંચી રહ્યું છે.
-
રિપીટ એ એવો ભાગ છે જે તેને "વાતચીત" કરવાને બદલે "એજન્ટિક" લાગે છે. લેંગચેન "એજન્ટ્સ" દસ્તાવેજો
કેટલાક એજન્ટો મૂળભૂત રીતે સ્માર્ટ મેક્રો હોય છે. અન્ય એક જુનિયર ઓપરેટરની જેમ કાર્ય કરે છે જે કાર્યોને હલ કરી શકે છે અને ભૂલોમાંથી પુનઃપ્રાપ્ત થઈ શકે છે. બંને મહત્વપૂર્ણ છે.
ઉપરાંત, તમારે સંપૂર્ણ સ્વાયત્તતાની જરૂર નથી. હકીકતમાં... તમને કદાચ તે જોઈતું નથી 🙃
૨) તમારે ક્યારે એજન્ટ બનાવવો જોઈએ (અને ક્યારે ન બનાવવો જોઈએ) 🚦
એજન્ટ બનાવો જ્યારે:
-
આ કાર્ય બહુ-પગલાંવાળું અને વચ્ચે શું થાય છે તેના આધારે બદલાય છે.
-
આ કાર્ય માટે ટૂલનો ઉપયોગ (ડેટાબેઝ, CRM, કોડ એક્ઝેક્યુશન, ફાઇલ જનરેશન, બ્રાઉઝર્સ, આંતરિક API) જરૂરી છે. લેંગચેન “ટૂલ્સ” દસ્તાવેજો
-
તમે પુનરાવર્તિત પરિણામો , ફક્ત એક જ વારના જવાબો નહીં.
-
તમે "થઈ ગયું" ને એવી રીતે વ્યાખ્યાયિત કરી શકો છો કે કમ્પ્યુટર તેને ચકાસી શકે, ભલે તે છૂટથી હોય.
એજન્ટ બનાવશો નહીં જ્યારે:
-
એક સરળ પ્રોમ્પ્ટ + રિસ્પોન્સ સમસ્યાનો ઉકેલ લાવી શકે છે (વધુ પડતી મહેનત ન કરો, પછીથી તમે તમારી જાતને નફરત કરશો).
-
તમારે સંપૂર્ણ નિશ્ચયવાદની જરૂર છે (એજન્ટો સુસંગત હોઈ શકે છે, પરંતુ રોબોટિક નહીં).
-
તમારી પાસે કનેક્ટ કરવા માટે કોઈ સાધનો કે ડેટા નથી - તો પછી તે મોટે ભાગે ફક્ત વાઇબ્સ છે.
ચાલો સ્પષ્ટ કહીએ: "AI એજન્ટ પ્રોજેક્ટ્સ" ના અડધા ભાગ થોડા બ્રાન્ચિંગ નિયમો સાથે વર્કફ્લો હોઈ શકે છે. પણ, ક્યારેક વાઇબ પણ મહત્વપૂર્ણ હોય છે 🤷♂️
૩) AI એજન્ટનું સારું સંસ્કરણ શું બનાવે છે ✅
તમે જે "સારું સંસ્કરણ શું બનાવે છે" વિભાગ માંગ્યો છે તે અહીં છે, સિવાય કે હું થોડી સ્પષ્ટતા કરીશ:
એઆઈ એજન્ટનું સારું સ્વરૂપ નથી જે સૌથી વધુ કઠિન વિચારે છે. તે એ છે કે જે:
-
શું કરવાની છૂટ છે તે જાણે છે (ક્ષેત્રની સીમાઓ)
-
સાધનોનો વિશ્વસનીય ઉપયોગ કરે છે (સ્ટ્રક્ચર્ડ કોલ્સ, રિટ્રીઝ, ટાઈમઆઉટ્સ) OpenAI ફંક્શન કોલિંગ માર્ગદર્શિકા AWS “ટાઇમઆઉટ્સ, રિટ્રીઝ અને જીટર સાથે બેકઓફ”
-
સ્થિતિને સ્વચ્છ રાખે છે (મેમરી જે સડતી નથી) લેંગચેન “મેમરી ઝાંખી”
-
તેની ક્રિયાઓ સમજાવે છે (ઓડિટ ટ્રેલ્સ, ગુપ્ત તર્ક ડમ્પ નહીં) NIST AI RMF 1.0 (વિશ્વસનીયતા અને પારદર્શિતા)
-
યોગ્ય રીતે અટકે છે (પૂર્ણતા તપાસ, મહત્તમ પગલાં, વૃદ્ધિ) લેંગચેન “એજન્ટ્સ” દસ્તાવેજો
-
સુરક્ષિત રીતે નિષ્ફળ જાય છે (મદદ માંગે છે, સત્તાનો ભ્રમ નથી કરતો) NIST AI RMF 1.0
-
પરીક્ષણ કરી શકાય તેવું છે (તમે તેને તૈયાર દૃશ્યો અને સ્કોર પરિણામો પર ચલાવી શકો છો)
જો તમારા એજન્ટનું પરીક્ષણ ન થઈ શકે, તો તે મૂળભૂત રીતે ખૂબ જ આત્મવિશ્વાસપૂર્ણ સ્લોટ મશીન છે. પાર્ટીઓમાં મજા, પ્રોડક્શનમાં ભયાનક 😬
૪) એજન્ટના મુખ્ય માળખાકીય તત્વો ("શરીરરચના" 🧩)
મોટાભાગના નક્કર એજન્ટોમાં આ ટુકડાઓ હોય છે:
A) કંટ્રોલર લૂપ 🔁
આ ઓર્કેસ્ટ્રેટર છે:
-
ધ્યેય લો
-
આગામી કાર્યવાહી માટે મોડેલને પૂછો
-
રન ટૂલ
-
અવલોકન ઉમેરો
-
લેંગચેન “એજન્ટ્સ” દસ્તાવેજો પૂર્ણ થાય ત્યાં સુધી પુનરાવર્તન કરો
B) સાધનો (ઉર્ફે ક્ષમતાઓ) 🧰
સાધનો એ એજન્ટને અસરકારક બનાવે છે: લેંગચેન “ટૂલ્સ” દસ્તાવેજો
-
ડેટાબેઝ ક્વેરીઝ
-
ઇમેઇલ્સ મોકલી રહ્યા છીએ
-
ફાઇલો ખેંચવી
-
રનિંગ કોડ
-
આંતરિક API ને કૉલ કરી રહ્યા છીએ
-
સ્પ્રેડશીટ્સ અથવા CRM માં લખવું
સી) સ્મૃતિ 🗃️
બે પ્રકારના મહત્વ:
-
ટૂંકા ગાળાની યાદશક્તિ : વર્તમાન દોડનો સંદર્ભ, તાજેતરના પગલાં, વર્તમાન યોજના
-
લાંબા ગાળાની યાદશક્તિ : વપરાશકર્તા પસંદગીઓ, પ્રોજેક્ટ સંદર્ભ, પ્રાપ્ત જ્ઞાન (ઘણીવાર એમ્બેડિંગ્સ + વેક્ટર સ્ટોર દ્વારા) RAG પેપર
ડી) આયોજન અને નિર્ણય નીતિ 🧭
ભલે તમે તેને "આયોજન" ન કહો, તમારે એક પદ્ધતિની જરૂર છે:
-
ચેકલિસ્ટ્સ
-
રીએક્ટ-શૈલી "પછી વિચારો" રીએક્ટ પેપર
-
કાર્ય આલેખ
-
સુપરવાઇઝર-વર્કર પેટર્ન
-
સુપરવાઇઝર-વર્કર પેટર્ન માઈક્રોસોફ્ટ ઓટોજેન (મલ્ટિ-એજન્ટ ફ્રેમવર્ક)
ઇ) ગાર્ડરેલ્સ અને મૂલ્યાંકન 🧯
-
પરવાનગીઓ
-
સલામત ટૂલ સ્કીમા OpenAI સ્ટ્રક્ચર્ડ આઉટપુટ
-
આઉટપુટ માન્યતા
-
પગલાની મર્યાદા
-
લોગીંગ
-
NIST AI RMF 1.0 નું પરીક્ષણ કરે છે
હા, તે પ્રોમ્પ્ટ કરવા કરતાં વધુ એન્જિનિયરિંગ છે. જે... કંઈક અંશે મુદ્દો છે.
૫) સરખામણી કોષ્ટક: એજન્ટ બનાવવાની લોકપ્રિય રીતો 🧾
નીચે એક વાસ્તવિક "સરખામણી કોષ્ટક" છે - થોડી ખાસિયતો સાથે, કારણ કે વાસ્તવિક ટીમો વિચિત્ર હોય છે 😄
| સાધન / ફ્રેમવર્ક | પ્રેક્ષક | કિંમત | તે કેમ કામ કરે છે | નોંધો (નાની અંધાધૂંધી) | |
|---|---|---|---|---|---|
| લેંગચેન | લેગો-શૈલીના ઘટકો પસંદ કરતા બિલ્ડરો | ફ્રી-ઇશ + ઇન્ફ્રા | સાધનો, મેમરી, સાંકળો માટે મોટી ઇકોસિસ્ટમ | જો તમે સ્પષ્ટ રીતે નામ ન આપો તો સ્પાઘેટ્ટી-ફાસ્ટ થઈ શકે છે | |
| લામાઇન્ડેક્સ | RAG-ભારે ટીમો | ફ્રી-ઇશ + ઇન્ફ્રા | મજબૂત પુનઃપ્રાપ્તિ પેટર્ન, ઇન્ડેક્સિંગ, કનેક્ટર્સ | જ્યારે તમારો એજન્ટ મૂળભૂત રીતે "શોધ + કાર્ય" કરે છે ત્યારે સારું... જે સામાન્ય છે | |
| ઓપનએઆઈ આસિસ્ટન્ટ્સ શૈલીનો અભિગમ | ઝડપી સેટઅપ ઇચ્છતી ટીમો | ઉપયોગ-આધારિત | બિલ્ટ-ઇન ટૂલ કોલિંગ પેટર્ન અને રન સ્ટેટ | કેટલાક ખૂણાઓમાં ઓછા લવચીક, પરંતુ ઘણી એપ્લિકેશનો માટે સ્વચ્છ | OpenAI API ચલાવે છે OpenAI Assistants ફંક્શન કોલિંગ |
| સિમેન્ટીક કર્નલ | વિકાસકર્તાઓ જે સ્ટ્રક્ચર્ડ ઓર્કેસ્ટ્રેશન ઇચ્છે છે | મુક્ત | કુશળતા/કાર્યો માટે સુઘડ અમૂર્તતા | "એન્ટરપ્રાઇઝ વ્યવસ્થિત" લાગે છે - ક્યારેક તે પ્રશંસા છે 😉 | |
| ઓટોજેન | મલ્ટિ-એજન્ટ પ્રયોગકર્તાઓ | મુક્ત | એજન્ટ-થી-એજન્ટ સહયોગ પેટર્ન | વધારે પડતી વાત કરી શકે છે; કડક સમાપ્તિ નિયમો સેટ કરો | |
| ક્રુએઆઈ | "એજન્ટોની ટીમો" ના ચાહકો | મુક્ત | ભૂમિકાઓ + કાર્યો + સોંપણીઓ વ્યક્ત કરવી સરળ છે | જ્યારે કાર્યો ચીકણા હોય, નરમ નહીં ત્યારે શ્રેષ્ઠ કાર્ય કરે છે | |
| ઘાસની ગંજી | શોધ + પાઇપલાઇન લોકો | મુક્ત | સોલિડ પાઇપલાઇન્સ, પુનઃપ્રાપ્તિ, ઘટકો | "એજન્ટ થિયેટર" ઓછું, "વ્યવહારુ ફેક્ટરી" વધુ | |
| તમારી પોતાની (કસ્ટમ લૂપ) રોલ કરો | કંટ્રોલ ફ્રીક્સ (પ્રેમાળ) | તમારો સમય | ન્યૂનતમ જાદુ, મહત્તમ સ્પષ્ટતા | સામાન્ય રીતે લાંબા ગાળા માટે શ્રેષ્ઠ... જ્યાં સુધી તમે બધું ફરીથી ન શોધો 😅 |
કોઈ એક વિજેતા નથી. શ્રેષ્ઠ પસંદગી તમારા એજન્ટનું મુખ્ય કાર્ય પુનઃપ્રાપ્તિ , ટૂલ એક્ઝિક્યુશન , મલ્ટિ-એજન્ટ કોઓર્ડિનેશન અથવા વર્કફ્લો ઓટોમેશન .
૬) સ્ટેપ-બાય-સ્ટેપ AI એજન્ટ કેવી રીતે બનાવવો (વાસ્તવિક રેસીપી) 🍳🤖
આ એ ભાગ છે જે મોટાભાગના લોકો છોડી દે છે, અને પછી વિચારે છે કે એજન્ટ પેન્ટ્રીમાં રેકૂન જેવું કેમ વર્તે છે.
પગલું ૧: એક વાક્યમાં કામ વ્યાખ્યાયિત કરો 🎯
ઉદાહરણો:
-
"નીતિ અને ટિકિટ સંદર્ભનો ઉપયોગ કરીને ગ્રાહકનો જવાબ તૈયાર કરો, પછી મંજૂરી માટે પૂછો."
-
"બગ રિપોર્ટની તપાસ કરો, તેને ફરીથી બનાવો અને સુધારો સૂચવો."
-
"અપૂર્ણ મીટિંગ નોંધોને કાર્યો, માલિકો અને સમયમર્યાદામાં ફેરવો."
જો તમે તેને સરળ રીતે વ્યાખ્યાયિત કરી શકતા નથી, તો તમારા એજન્ટ પણ નહીં કરી શકે. મારો મતલબ એ છે કે તે કરી શકે છે, પરંતુ તે ઇમ્પ્રુવાઇઝ કરશે, અને ઇમ્પ્રુવાઇઝેશન એ એવી જગ્યા છે જ્યાં બજેટ મરી જાય છે.
પગલું 2: સ્વાયત્તતા સ્તર નક્કી કરો (ઓછું, મધ્યમ, મસાલેદાર) 🌶️
-
ઓછી સ્વાયત્તતા : પગલાં સૂચવે છે, માનવ ક્લિક્સ "મંજૂરી આપે છે"
-
માધ્યમ : ટૂલ્સ ચલાવે છે, આઉટપુટ ડ્રાફ્ટ કરે છે, અનિશ્ચિતતા પર વધે છે
-
ઉચ્ચ : શરૂઆતથી અંત સુધી ચલાવે છે, ફક્ત અપવાદો પર માનવોને પિંગ કરે છે
તમે ઇચ્છો તેના કરતાં નીચેથી શરૂઆત કરો. તમે તેને પછીથી વધારી શકો છો.
પગલું 3: તમારી મોડેલ વ્યૂહરચના પસંદ કરો 🧠
તમે સામાન્ય રીતે પસંદ કરો છો:
-
દરેક વસ્તુ માટે એક મજબૂત મોડેલ (સરળ)
-
સસ્તા પગલાં માટે એક મજબૂત મોડેલ + નાનું મોડેલ (વર્ગીકરણ, રૂટીંગ)
-
જો જરૂરી હોય તો વિશિષ્ટ મોડેલો (દ્રષ્ટિ, કોડ, વાણી)
આ પણ નક્કી કરો:
-
મહત્તમ ટોકન્સ
-
તાપમાન
-
શું તમે આંતરિક રીતે લાંબા તર્કના નિશાનોને મંજૂરી આપો છો (તમે કરી શકો છો, પરંતુ અંતિમ વપરાશકર્તાઓ સમક્ષ કાચા વિચારોની સાંકળનો ખુલાસો કરશો નહીં)
પગલું 4: કડક સ્કીમા સાથે ટૂલ્સ વ્યાખ્યાયિત કરો 🔩
સાધનો આ હોવા જોઈએ:
-
સાંકડું
-
ટાઇપ કરેલ
-
પરવાનગી આપેલ
do_anything(input: string) નામના ટૂલને બદલે , બનાવો:
-
search_kb(ક્વેરી: સ્ટ્રિંગ) -> પરિણામો[] -
ટિકિટ બનાવો (શીર્ષક: સ્ટ્રિંગ, બોડી: સ્ટ્રિંગ, પ્રાથમિકતા: enum) -> ટિકિટ_આઈડી -
send_email(to: string, subject: string, body: string) -> statusOpenAI ફંક્શન કોલિંગ માર્ગદર્શિકા
જો તમે એજન્ટને ચેઇનસો આપો છો, તો જ્યારે તે વાડ દૂર કરીને હેજને ટ્રિમ કરે છે ત્યારે ચોંકશો નહીં.
પગલું ૫: કંટ્રોલર લૂપ બનાવો 🔁
ન્યૂનતમ લૂપ:
-
ધ્યેય + પ્રારંભિક સંદર્ભથી શરૂઆત કરો
-
મોડેલને પૂછો: "આગળની કાર્યવાહી?"
-
જો ટૂલ કોલ - એક્ઝિક્યુટ ટૂલ
-
અવલોકન ઉમેરો
-
સ્ટોપ સ્થિતિ તપાસો
-
લેંગચેન “એજન્ટ્સ” દસ્તાવેજોનું પુનરાવર્તન કરો (મહત્તમ પગલાં સાથે)
ઉમેરો:
-
સમયસમાપ્તિ
-
પુનઃપ્રયાસ (સાવધાની - પુનઃપ્રયાસ લૂપ થઈ શકે છે) AWS “સમયસમાપ્તિ, પુનઃપ્રયાસ, અને જીટર સાથે બેકઓફ”
-
ટૂલ ભૂલ ફોર્મેટિંગ (સ્પષ્ટ, સંરચિત)
પગલું ૬: કાળજીપૂર્વક મેમરી ઉમેરો 🗃️
ટૂંકા ગાળા માટે: દરેક પગલા પર એક કોમ્પેક્ટ "સ્ટેટ સારાંશ" અપડેટ રાખો. લેંગચેન "મેમરી ઝાંખી"
લાંબા ગાળા માટે: ટકાઉ તથ્યો (વપરાશકર્તા પસંદગીઓ, સંસ્થાના નિયમો, સ્થિર દસ્તાવેજો) સંગ્રહિત કરો.
અંગૂઠાનો નિયમ:
-
જો તે વારંવાર બદલાય છે - તો તેને ટૂંકા ગાળા માટે રાખો
-
જો તે સ્થિર હોય તો - લાંબા ગાળા માટે સંગ્રહ કરો
-
જો તે સંવેદનશીલ હોય તો - ઓછામાં ઓછું સંગ્રહ કરો (અથવા બિલકુલ નહીં)
પગલું 7: માન્યતા અને "ક્રિટિક" પાસ ઉમેરો 🧪
એક સસ્તી, વ્યવહારુ પેટર્ન:
-
એજન્ટ પરિણામ ઉત્પન્ન કરે છે
-
માન્યકર્તા માળખું અને અવરોધો તપાસે છે
-
ગુમ થયેલ પગલાં અથવા નીતિ ઉલ્લંઘન માટે વૈકલ્પિક વિવેચક મોડેલ સમીક્ષાઓ NIST AI RMF 1.0
સંપૂર્ણ નથી, પણ તેમાં ઘણી બધી બકવાસની ચોંકાવનારી વાતો પકડાય છે.
પગલું 8: લોગ ન કરવાનો તમને અફસોસ થશે તે બધું લોગ કરો 📜
લોગ:
-
ટૂલ કોલ્સ + ઇનપુટ્સ + આઉટપુટ
-
લીધેલા નિર્ણયો
-
ભૂલો
-
અંતિમ આઉટપુટ
-
ટોકન્સ અને લેટન્સી ઓપનટેલિમેટ્રી ઓબ્ઝર્વેબિલિટી પ્રાઈમર
ભવિષ્ય - તમે તમારો આભાર માનશો. વર્તમાન - તમે ભૂલી જશો. બસ આ જ જીવન છે 😵💫
૭) એવું સાધન જે તમારા આત્માને તોડતું નથી 🧰😵
ટૂલ કોલિંગ એ છે જ્યાં "એઆઈ એજન્ટ કેવી રીતે બનાવવો" વાસ્તવિક સોફ્ટવેર એન્જિનિયરિંગ બને છે.
સાધનોને ભરોસાપાત્ર બનાવો (ભરોસાપાત્ર સારું છે)
વિશ્વસનીય સાધનો છે:
-
નિયતિવાદી
-
મર્યાદિત અવકાશ
-
પરીક્ષણ કરવા માટે સરળ
-
સ્ટ્રાઇપ "આઇડમ્પોટેન્ટ રિક્વેસ્ટ્સ" ફરીથી ચલાવવા માટે સલામત
ટૂલ લેયર પર ગાર્ડરેલ્સ ઉમેરો, ફક્ત પ્રોમ્પ્ટ જ નહીં
પ્રોમ્પ્ટ નમ્ર સૂચનો છે. ટૂલ વેલિડેશન એક લૉક કરેલો દરવાજો છે. OpenAI સ્ટ્રક્ચર્ડ આઉટપુટ
કરો:
-
અલાઉલિસ્ટ્સ (કયા ટૂલ્સ ચાલી શકે છે)
-
ઇનપુટ માન્યતા
-
દર મર્યાદા OpenAI દર મર્યાદા માર્ગદર્શિકા
-
પ્રતિ વપરાશકર્તા/સંસ્થા પરવાનગી ચકાસણી
-
જોખમી ક્રિયાઓ માટે "ડ્રાય-રન મોડ"
આંશિક નિષ્ફળતા માટે ડિઝાઇન
સાધનો નિષ્ફળ જાય છે. નેટવર્ક્સ ધ્રુજે છે. પ્રમાણીકરણ સમાપ્ત થાય છે. એજન્ટે આ કરવું આવશ્યક છે:
-
ભૂલોનું અર્થઘટન કરો
-
યોગ્ય હોય ત્યારે બેકઓફ સાથે ફરીથી પ્રયાસ કરો Google ક્લાઉડ ફરીથી પ્રયાસ વ્યૂહરચના (બેકઓફ + જીટર)
-
વૈકલ્પિક સાધનો પસંદ કરો
-
અટકી જાય ત્યારે વધારો
એક શાંત અસરકારક યુક્તિ: માળખાગત ભૂલો પરત કરો જેમ કે:
-
પ્રકાર: auth_error -
પ્રકાર: not_found -
પ્રકાર: rate_limited
જેથી મોડેલ ગભરાવાને બદલે બુદ્ધિપૂર્વક પ્રતિભાવ આપી શકે.
૮) એવી યાદશક્તિ જે તમને સતાવવાને બદલે મદદ કરે છે 👻🗂️
યાદશક્તિ શક્તિશાળી છે, પણ તે કચરાના ડબ્બામાં પણ ફેરવાઈ શકે છે.
ટૂંકા ગાળાની યાદશક્તિ: તેને સંકુચિત રાખો
વાપરવુ:
-
છેલ્લા N પગલાં
-
ચાલી રહેલ સારાંશ (દરેક લૂપ અપડેટ થયેલ)
-
વર્તમાન યોજના
-
વર્તમાન મર્યાદાઓ (બજેટ, સમય, નીતિઓ)
જો તમે બધું સંદર્ભમાં નાખો છો, તો તમને મળશે:
-
વધારે ખર્ચ
-
ધીમી વિલંબતા
-
વધુ મૂંઝવણ (હા, તો પણ)
લાંબા ગાળાની યાદશક્તિ: "સ્ટફિંગ" ઉપર પુનઃપ્રાપ્તિ
મોટાભાગની "લાંબા ગાળાની યાદશક્તિ" આના જેવી હોય છે:
-
એમ્બેડિંગ્સ
-
વેક્ટર સ્ટોર
-
પુનઃપ્રાપ્તિ સંવર્ધિત પેઢી (RAG) RAG પેપર
એજન્ટ યાદ રાખતો નથી. તે રનટાઇમ પર સૌથી સુસંગત સ્નિપેટ્સ મેળવે છે. LlamaIndex “RAG નો પરિચય”
વ્યવહારુ યાદશક્તિના નિયમો
-
"પસંદગીઓ" ને સ્પષ્ટ તથ્યો તરીકે સંગ્રહિત કરો: "વપરાશકર્તાને બુલેટ સારાંશ ગમે છે અને ઇમોજીસ નફરત છે" (lol, અહીં નહીં 😄)
-
"નિર્ણયો" ને ટાઇમસ્ટેમ્પ અથવા સંસ્કરણો સાથે સંગ્રહિત કરો (નહીં તો વિરોધાભાસનો ઢગલો થશે)
-
ખરેખર જરૂર ન પડે ત્યાં સુધી ક્યારેય રહસ્યો સંગ્રહિત ન કરો
અને અહીં મારો અપૂર્ણ રૂપક છે: યાદશક્તિ રેફ્રિજરેટર જેવી છે. જો તમે તેને ક્યારેય સાફ નહીં કરો, તો આખરે તમારા સેન્ડવીચનો સ્વાદ ડુંગળી અને પસ્તાવો જેવો લાગશે.
9) આયોજન પેટર્ન (સરળથી ફેન્સી સુધી) 🧭✨
આયોજન ફક્ત નિયંત્રિત વિઘટન છે. તેને રહસ્યમય ન બનાવો.
પેટર્ન A: ચેકલિસ્ટ પ્લાનર ✅
-
મોડેલ પગલાંઓની યાદી દર્શાવે છે
-
પગલું-દર-પગલાં અમલમાં મૂકે છે
-
ચેકલિસ્ટ સ્ટેટસ અપડેટ કરે છે
ઓનબોર્ડિંગ માટે ઉત્તમ. સરળ, પરીક્ષણયોગ્ય.
પેટર્ન B: રીએક્ટ લૂપ (કારણ + કાર્ય) 🧠→🧰
-
મોડેલ આગામી ટૂલ કોલ નક્કી કરે છે
-
આઉટપુટનું અવલોકન કરે છે
-
રીએક્ટ પેપરનું પુનરાવર્તન કરે છે
આ ક્લાસિક એજન્ટ ફીલ છે.
પેટર્ન C: સુપરવાઇઝર-કાર્યકર 👥
-
સુપરવાઇઝર ધ્યેયને કાર્યોમાં વિભાજીત કરે છે
-
કામદારો વિશિષ્ટ કાર્યો કરે છે
-
સુપરવાઇઝર પરિણામોને મર્જ કરે છે માઈક્રોસોફ્ટ ઓટોજેન (મલ્ટિ-એજન્ટ ફ્રેમવર્ક)
જ્યારે કાર્યો સમાંતર હોય, અથવા જ્યારે તમને વિવિધ "ભૂમિકાઓ" જોઈતી હોય જેમ કે: ત્યારે આ મૂલ્યવાન છે
-
સંશોધક
-
કોડર
-
સંપાદક
-
QA તપાસનાર
પેટર્ન D: ફરીથી આયોજન સાથે યોજના બનાવો-પછી-અમલ કરો 🔄
-
યોજના બનાવો
-
અમલમાં મૂકવું
-
જો સાધનના પરિણામો વાસ્તવિકતા બદલી નાખે, તો ફરીથી આયોજન કરો
આ એજન્ટને ખરાબ યોજનાને અનુસરવાથી અટકાવે છે. મનુષ્યો પણ આ કરે છે, સિવાય કે તેઓ થાકેલા હોય, આ કિસ્સામાં તેઓ ખરાબ યોજનાઓને પણ અનુસરે છે.
૧૦) સલામતી, વિશ્વસનીયતા, અને નોકરીમાંથી કાઢી ન મૂકવું 🔐😅
જો તમારા એજન્ટ પગલાં લઈ શકે છે, તો તમારે સલામતી ડિઝાઇનની જરૂર છે. "હોવું સરસ" નહીં. જરૂર છે. NIST AI RMF 1.0
સખત મર્યાદાઓ
-
પ્રતિ દોડ મહત્તમ પગલાં
-
પ્રતિ મિનિટ મહત્તમ ટૂલ કોલ
-
સત્ર દીઠ મહત્તમ ખર્ચ (ટોકન બજેટ)
-
મંજૂરી પાછળ પ્રતિબંધિત સાધનો
ડેટા હેન્ડલિંગ
-
લોગિંગ કરતા પહેલા સંવેદનશીલ ઇનપુટ્સને સંપાદિત કરો
-
અલગ વાતાવરણ (ડેવલપમેન્ટ વિરુદ્ધ ઉત્પાદન)
-
ઓછામાં ઓછા વિશેષાધિકાર પ્રાપ્ત સાધન પરવાનગીઓ
વર્તણૂકીય અવરોધો
-
એજન્ટને આંતરિક પુરાવાના ટુકડાઓ ટાંકવા માટે દબાણ કરો (બાહ્ય લિંક્સ નહીં, ફક્ત આંતરિક સંદર્ભો)
-
જ્યારે આત્મવિશ્વાસ ઓછો હોય ત્યારે અનિશ્ચિતતા ફ્લેગ્સની જરૂર પડે છે
-
જો ઇનપુટ્સ અસ્પષ્ટ હોય તો "સ્પષ્ટતા પ્રશ્ન પૂછો" જરૂરી છે
વિશ્વસનીય એજન્ટ સૌથી વધુ આત્મવિશ્વાસુ હોતો નથી. તે એ છે જે જાણે છે કે તે ક્યારે અનુમાન લગાવી રહ્યો છે... અને તે એમ કહે છે.
૧૧) પરીક્ષણ અને મૂલ્યાંકન (જે ભાગ બધા ટાળે છે) 🧪📏
તમે જે માપી શકતા નથી તેને સુધારી શકતા નથી. હા, તે વાક્ય ચીઝી છે, પણ તે હેરાન કરનારું સાચું છે.
દૃશ્ય સેટ બનાવો
30-100 ટેસ્ટ કેસ બનાવો:
-
સુખી રસ્તાઓ
-
ધાર કેસ
-
"સાધન નિષ્ફળ જાય છે" કેસો
-
અસ્પષ્ટ વિનંતીઓ
-
વિરોધી પ્રોમ્પ્ટ (પ્રોમ્પ્ટ ઇન્જેક્શન પ્રયાસો) OWASP LLM એપ્લિકેશન્સ માટે ટોચના 10 OWASP LLM01 પ્રોમ્પ્ટ ઇન્જેક્શન
સ્કોર પરિણામો
આના જેવા મેટ્રિક્સનો ઉપયોગ કરો:
-
કાર્ય સફળતા દર
-
પૂર્ણ થવાનો સમય
-
સાધન ભૂલ પુનઃપ્રાપ્તિ દર
-
ભ્રામકતા દર (પુરાવા વિનાના દાવાઓ)
-
માનવ મંજૂરી દર (જો દેખરેખ હેઠળ હોય તો)
પ્રોમ્પ્ટ અને ટૂલ્સ માટે રીગ્રેશન પરીક્ષણો
તમે ગમે ત્યારે બદલો:
-
ટૂલ સ્કીમા
-
સિસ્ટમ સૂચનાઓ
-
પુનઃપ્રાપ્તિ તર્ક
-
મેમરી ફોર્મેટ
ફરીથી સ્યુટ ચલાવો.
એજન્ટો સંવેદનશીલ પ્રાણીઓ છે. ઘરના છોડની જેમ, પણ વધુ ખર્ચાળ.
૧૨) ડિપ્લોયમેન્ટ પેટર્ન જે તમારા બજેટને ઓગાળતા નથી 💸🔥
એક જ સેવાથી શરૂઆત કરો
-
એજન્ટ નિયંત્રક API
-
તેની પાછળની સાધન સેવાઓ
-
લોગીંગ + મોનિટરિંગ ઓપનટેલિમેટ્રી અવલોકનક્ષમતા પ્રાઈમર
ખર્ચ નિયંત્રણો વહેલા ઉમેરો
-
કેશીંગ પુનઃપ્રાપ્તિ પરિણામો
-
સારાંશ સાથે વાતચીત સ્થિતિને સંકુચિત કરવી
-
રૂટીંગ અને નિષ્કર્ષણ માટે નાના મોડેલોનો ઉપયોગ
-
"ઊંડા વિચારસરણી" ને સૌથી મુશ્કેલ પગલાં સુધી મર્યાદિત રાખવું
સામાન્ય સ્થાપત્ય પસંદગી
-
સ્ટેટલેસ કંટ્રોલર + એક્સટર્નલ સ્ટેટ સ્ટોર (DB/redis)
-
શક્ય હોય ત્યાં ટૂલ કોલ્સ અયોગ્ય છે સ્ટ્રાઇપ "અયોગ્ય વિનંતીઓ"
-
લાંબા કાર્યો માટે કતાર (જેથી તમારી પાસે વેબ વિનંતી કાયમ માટે ખુલ્લી ન રહે)
અને: "કિલ સ્વિચ" બનાવો. જ્યાં સુધી તમને ખરેખર તેની જરૂર ન પડે ત્યાં સુધી તમને તેની જરૂર નહીં પડે 😬
૧૩) સમાપન નોંધ - AI એજન્ટ કેવી રીતે બનાવવો તેનું ટૂંકું સંસ્કરણ 🎁🤖
જો તમને બીજું કંઈ યાદ ન હોય, તો આ યાદ રાખો:
-
AI એજન્ટ કેવી રીતે બનાવવો તે મોટે ભાગે મોડેલની આસપાસ સલામત લૂપ બનાવવા વિશે છે. LangChain “એજન્ટ્સ” દસ્તાવેજો
-
સ્પષ્ટ ધ્યેય, ઓછી સ્વાયત્તતા અને કડક સાધનોથી શરૂઆત કરો. OpenAI સ્ટ્રક્ચર્ડ આઉટપુટ
-
અનંત સંદર્ભ ભરણ દ્વારા નહીં, પરંતુ પુનઃપ્રાપ્તિ દ્વારા મેમરી ઉમેરો. RAG પેપર
-
આયોજન સરળ હોઈ શકે છે - ચેકલિસ્ટ અને પુનઃઆયોજન ખૂબ આગળ વધે છે.
-
લોગીંગ અને પરીક્ષણો એજન્ટ અરાજકતાને એવી વસ્તુમાં ફેરવે છે જે તમે મોકલી શકો છો. ઓપનટેલિમેટ્રી ઓબ્ઝર્વેબિલિટી પ્રાઈમર
-
ગાર્ડરેલ્સ ફક્ત પ્રોમ્પ્ટમાં નહીં, પણ કોડમાં હોય છે. LLM એપ્સ માટે OWASP ટોપ 10
એજન્ટ જાદુ નથી. તે એક એવી સિસ્ટમ છે જે ઘણીવાર સારા નિર્ણયો લે છે જે મૂલ્યવાન બની શકે છે... અને નુકસાન પહોંચાડતા પહેલા હાર સ્વીકારે છે. શાંતિથી દિલાસો આપનારું, એક રીતે 😌
અને હા, જો તમે તેને યોગ્ય રીતે બનાવો છો, તો એવું લાગે છે કે એક નાના ડિજિટલ ઇન્ટર્નને નોકરી પર રાખવો જે ક્યારેય સૂતો નથી, ક્યારેક ગભરાઈ જાય છે, અને કાગળકામને પ્રેમ કરે છે. તો, મૂળભૂત રીતે એક ઇન્ટર્ન.
વારંવાર પૂછાતા પ્રશ્નો
સરળ શબ્દોમાં કહીએ તો AI એજન્ટ શું છે?
AI એજન્ટ મૂળભૂત રીતે એક લૂપ છે જે પુનરાવર્તન કરે છે: ઇનપુટ લો, આગળનું પગલું નક્કી કરો, ટૂલનો ઉપયોગ કરો, પરિણામ વાંચો અને તે પૂર્ણ થાય ત્યાં સુધી પુનરાવર્તન કરો. "એજન્ટિક" ભાગ ફક્ત ચેટિંગથી નહીં, પરંતુ અભિનય અને નિરીક્ષણથી આવે છે. ઘણા એજન્ટો ફક્ત ટૂલ એક્સેસ સાથે સ્માર્ટ ઓટોમેશન હોય છે, જ્યારે અન્ય એક જુનિયર ઓપરેટરની જેમ વર્તે છે જે ભૂલોમાંથી પુનઃપ્રાપ્ત થઈ શકે છે.
ફક્ત પ્રોમ્પ્ટનો ઉપયોગ કરવાને બદલે મારે ક્યારે AI એજન્ટ બનાવવો જોઈએ?
જ્યારે કાર્ય બહુ-પગલાંવાળું હોય, મધ્યવર્તી પરિણામોના આધારે બદલાતું હોય અને વિશ્વસનીય સાધન ઉપયોગ (API, ડેટાબેઝ, ટિકિટિંગ, કોડ એક્ઝેક્યુશન) ની જરૂર હોય ત્યારે એજન્ટ બનાવો. જ્યારે તમે રેલ અને "થઈ ગયું" તપાસવાની રીત સાથે પુનરાવર્તિત પરિણામો ઇચ્છતા હોવ ત્યારે એજન્ટ પણ ઉપયોગી છે. જો એક સરળ પ્રોમ્પ્ટ-રિસ્પોન્સ કામ કરે છે, તો એજન્ટ સામાન્ય રીતે બિનજરૂરી ઓવરહેડ અને વધારાના નિષ્ફળતા મોડ્સનો ઉપયોગ કરે છે.
હું એવો AI એજન્ટ કેવી રીતે બનાવી શકું જે લૂપ્સમાં અટવાઈ ન જાય?
હાર્ડ સ્ટોપ શરતોનો ઉપયોગ કરો: મહત્તમ પગલાં, મહત્તમ ટૂલ કૉલ્સ અને સ્પષ્ટ પૂર્ણતા તપાસો. સ્ટ્રક્ચર્ડ ટૂલ સ્કીમા, સમયસમાપ્તિ અને પુનઃપ્રયાસ ઉમેરો જે હંમેશા માટે પુનઃપ્રયાસ નહીં કરે. નિર્ણયો અને ટૂલ આઉટપુટ લોગ કરો જેથી તમે જોઈ શકો કે તે ક્યાં પાટા પરથી ઉતરે છે. એક સામાન્ય સલામતી વાલ્વ એસ્કેલેશન છે: જો એજન્ટ અનિશ્ચિત હોય અથવા ભૂલોનું પુનરાવર્તન કરે, તો તેણે ઇમ્પ્રુવાઇઝ કરવાને બદલે મદદ માંગવી જોઈએ.
AI એજન્ટ કેવી રીતે બનાવવો તે માટે ન્યૂનતમ આર્કિટેક્ચર શું છે?
ઓછામાં ઓછું તમારે એક કંટ્રોલર લૂપની જરૂર છે જે મોડેલને ધ્યેય અને સંદર્ભ આપે, આગળની ક્રિયા માટે પૂછે, વિનંતી કરવામાં આવે તો ટૂલ ચલાવે, અવલોકન ઉમેરે અને પુનરાવર્તન કરે. તમારે કડક ઇનપુટ/આઉટપુટ આકારો અને "પૂર્ણ" તપાસવાળા ટૂલ્સની પણ જરૂર છે. જો તમે રાજ્યને સ્વચ્છ રાખો અને પગલાની મર્યાદા લાગુ કરો તો રોલ-યોર-ઓન લૂપ પણ સારી રીતે કાર્ય કરી શકે છે.
ઉત્પાદનમાં વિશ્વસનીય બને તે માટે મારે ટૂલ કોલિંગ કેવી રીતે ડિઝાઇન કરવું જોઈએ?
ટૂલ્સને સાંકડા, ટાઇપ કરેલા, પરવાનગીવાળા અને માન્ય રાખો—જેનેરિક “do_anything” ટૂલ ટાળો. કડક સ્કીમા (જેમ કે સ્ટ્રક્ચર્ડ આઉટપુટ/ફંક્શન કોલિંગ) પસંદ કરો જેથી એજન્ટ ઇનપુટ્સને હેન્ડ-વેવ ન કરી શકે. ટૂલ લેયર પર અલોલિસ્ટ્સ, રેટ લિમિટ્સ અને યુઝર/ઓર્ગ પરવાનગી ચેક્સ ઉમેરો. આઇડેમ્પોટેન્સી પેટર્નનો ઉપયોગ કરીને, શક્ય હોય ત્યારે ફરીથી ચલાવવા માટે સલામત રીતે ટૂલ્સ ડિઝાઇન કરો.
એજન્ટને વધુ ખરાબ કર્યા વિના મેમરી ઉમેરવાનો શ્રેષ્ઠ રસ્તો કયો છે?
મેમરીને બે ભાગોમાં ગણો: ટૂંકા ગાળાની રન સ્થિતિ (તાજેતરના પગલાં, વર્તમાન યોજના, મર્યાદાઓ) અને લાંબા ગાળાની પુનઃપ્રાપ્તિ (પસંદગીઓ, સ્થિર નિયમો, સંબંધિત દસ્તાવેજો). ટૂંકા ગાળાની કોમ્પેક્ટને ચાલી રહેલા સારાંશ સાથે રાખો, સંપૂર્ણ ટ્રાન્સક્રિપ્ટ્સ સાથે નહીં. લાંબા ગાળાની મેમરી માટે, પુનઃપ્રાપ્તિ (એમ્બેડિંગ્સ + વેક્ટર સ્ટોર/RAG પેટર્ન) સામાન્ય રીતે સંદર્ભમાં બધું "સ્ટફિંગ" કરવાથી અને મોડેલને ગૂંચવવામાંથી બચાવે છે.
મારે કયા આયોજન પેટર્નનો ઉપયોગ કરવો જોઈએ: ચેકલિસ્ટ, રીએક્ટ, કે સુપરવાઇઝર-વર્કર?
જ્યારે કાર્યો અનુમાનિત હોય અને તમે કંઈક સરળ પરીક્ષણ કરવા માંગતા હોવ ત્યારે ચેકલિસ્ટ પ્લાનર ઉત્તમ છે. જ્યારે ટૂલના પરિણામો તમારા આગળના કાર્યમાં ફેરફાર કરે છે ત્યારે ReAct-શૈલીના લૂપ્સ ચમકે છે. સુપરવાઇઝર-વર્કર પેટર્ન (જેમ કે AutoGen-શૈલી ભૂમિકા અલગ પાડવી) જ્યારે કાર્યોને સમાંતર બનાવી શકાય છે અથવા અલગ ભૂમિકાઓ (સંશોધક, કોડર, QA) થી લાભ મેળવી શકાય છે ત્યારે મદદ કરે છે. હઠીલા ખરાબ યોજનાઓને ટાળવા માટે યોજના બનાવો-પછી-એક્ઝિક્યુટ કરો એ એક વ્યવહારુ મધ્યમ જમીન છે.
જો એજન્ટ વાસ્તવિક પગલાં લઈ શકે તો હું તેને કેવી રીતે સુરક્ષિત બનાવી શકું?
ઓછામાં ઓછા વિશેષાધિકારો ધરાવતી પરવાનગીઓનો ઉપયોગ કરો અને મંજૂરી અથવા "ડ્રાય-રન" મોડ્સ પાછળ જોખમી સાધનોને પ્રતિબંધિત કરો. બજેટ અને કેપ્સ ઉમેરો: મહત્તમ પગલાં, મહત્તમ ખર્ચ અને પ્રતિ-મિનિટ ટૂલ કોલ મર્યાદા. લોગિંગ પહેલાં સંવેદનશીલ ડેટાને સંપાદિત કરો અને ડેવલપમેન્ટને ઉત્પાદન વાતાવરણથી અલગ કરો. જ્યારે ઇનપુટ્સ અસ્પષ્ટ હોય ત્યારે અનિશ્ચિતતા ફ્લેગ્સ અથવા સ્પષ્ટતા પ્રશ્નોની જરૂર પડે છે, તેના બદલે વિશ્વાસને પુરાવાને બદલવા દો.
સમય જતાં તેમાં સુધારો થાય તે માટે હું AI એજન્ટનું પરીક્ષણ અને મૂલ્યાંકન કેવી રીતે કરી શકું?
હેપી પાથ, એજ કેસ, ટૂલ નિષ્ફળતાઓ, અસ્પષ્ટ વિનંતીઓ અને પ્રોમ્પ્ટ-ઇન્જેક્શન પ્રયાસો (OWASP-શૈલી) સાથે એક દૃશ્ય સ્યુટ બનાવો. કાર્ય સફળતા, સમય-પૂર્ણતા, ટૂલ ભૂલોમાંથી પુનઃપ્રાપ્તિ અને પુરાવા વિના દાવાઓ જેવા પરિણામો મેળવો. જ્યારે પણ તમે ટૂલ સ્કીમા, પ્રોમ્પ્ટ, પુનઃપ્રાપ્તિ અથવા મેમરી ફોર્મેટિંગ બદલો છો, ત્યારે સ્યુટ ફરીથી ચલાવો. જો તમે તેનું પરીક્ષણ કરી શકતા નથી, તો તમે તેને વિશ્વસનીય રીતે મોકલી શકતા નથી.
વિલંબ અને ખર્ચમાં વધારો કર્યા વિના હું એજન્ટને કેવી રીતે તૈનાત કરી શકું?
એક સામાન્ય પેટર્ન એ સ્ટેટલેસ કંટ્રોલર છે જેમાં બાહ્ય સ્ટેટ સ્ટોર (DB/Redis), તેની પાછળ ટૂલ સેવાઓ અને મજબૂત લોગિંગ/મોનિટરિંગ (ઘણીવાર OpenTelemetry) હોય છે. પુનઃપ્રાપ્તિ કેશીંગ, કોમ્પેક્ટ સ્ટેટ સારાંશ, રૂટીંગ/એક્સટ્રેક્શન માટે નાના મોડેલ્સ અને "ઊંડા વિચાર" ને સૌથી મુશ્કેલ પગલાં સુધી મર્યાદિત કરીને ખર્ચ નિયંત્રિત કરો. લાંબા કાર્યો માટે કતારોનો ઉપયોગ કરો જેથી તમે વેબ વિનંતીઓ ખુલ્લી ન રાખી શકો. હંમેશા કિલ સ્વિચ શામેલ કરો.
સંદર્ભ
-
નેશનલ ઇન્સ્ટિટ્યૂટ ઓફ સ્ટાન્ડર્ડ્સ એન્ડ ટેકનોલોજી (NIST) - NIST AI RMF 1.0 (વિશ્વસનીયતા અને પારદર્શિતા) - nvlpubs.nist.gov
-
ઓપનએઆઈ - સ્ટ્રક્ચર્ડ આઉટપુટ - platform.openai.com
-
ઓપનએઆઈ - ફંક્શન કોલિંગ માર્ગદર્શિકા - platform.openai.com
-
ઓપનએઆઈ - દર મર્યાદા માર્ગદર્શિકા - platform.openai.com
-
OpenAI - API ચલાવે છે - platform.openai.com
-
ઓપનએઆઈ - આસિસ્ટન્ટ ફંક્શન કોલિંગ - platform.openai.com
-
લેંગચેન - એજન્ટ્સ દસ્તાવેજો (જાવાસ્ક્રિપ્ટ) - docs.langchain.com
-
લેંગચેન - ટૂલ્સ ડોક્સ (પાયથોન) - docs.langchain.com
-
લેંગચેન - મેમરી ઝાંખી - docs.langchain.com
-
arXiv - રીએક્ટ પેપર (કારણ + અધિનિયમ) - arxiv.org
-
arXiv - RAG પેપર - arxiv.org
-
એમેઝોન વેબ સર્વિસીસ (AWS) બિલ્ડર્સ લાઇબ્રેરી - સમયસમાપ્તિ, પુનઃપ્રયાસ અને જીટર સાથે બેકઓફ - aws.amazon.com
-
ઓપનટેલિમેટ્રી - ઓબ્ઝર્વેબિલિટી પ્રાઈમર - opentelemetry.io
-
સ્ટ્રાઇપ - અયોગ્ય વિનંતીઓ - docs.stripe.com
-
ગૂગલ ક્લાઉડ - ફરીથી પ્રયાસ કરવાની વ્યૂહરચના (બેકઓફ + જીટર) - docs.cloud.google.com
-
OWASP - મોટી ભાષા મોડેલ એપ્લિકેશનો માટે ટોચના 10 - owasp.org
-
OWASP - LLM01 પ્રોમ્પ્ટ ઇન્જેક્શન - genai.owasp.org
-
LlamaIndex - RAG નો પરિચય - developers.llamaindex.ai
-
માઈક્રોસોફ્ટ - સિમેન્ટીક કર્નલ - learn.microsoft.com
-
માઈક્રોસોફ્ટ ઓટોજેન - મલ્ટી-એજન્ટ ફ્રેમવર્ક (દસ્તાવેજીકરણ) - microsoft.github.io
-
CrewAI - એજન્ટ્સના ખ્યાલો - docs.crewai.com
-
હેસ્ટૅક (ડીપસેટ) - રીટ્રીવર્સ દસ્તાવેજીકરણ - docs.haystack.deepset.ai