રાસ્પબેરી પાઇ સાથે DIY AI સહાયક કેવી રીતે બનાવવું

રાસ્પબેરી પાઇ સાથે DIY AI સહાયક કેવી રીતે બનાવવું

એક નાનું વૉઇસ આસિસ્ટન્ટ ઇચ્છો છો જે ખરેખર તમારા લીડને અનુસરે, તમારા પોતાના હાર્ડવેર પર ચાલે, અને ભૂલથી તમને સાંભળવામાં ન આવે એટલે ભૂલથી બાર અનાનસનો ઓર્ડર ન આપે? રાસ્પબેરી પાઇ સાથેનો DIY AI આસિસ્ટન્ટ આશ્ચર્યજનક રીતે પ્રાપ્ત કરી શકાય તેવો, મનોરંજક અને લવચીક છે. તમે એક વેક વર્ડ, સ્પીચ રેકગ્નિશન (ASR = ઓટોમેટિક સ્પીચ રેકગ્નિશન), નેચરલ લેંગ્વેજ માટે મગજ (નિયમો અથવા LLM), અને ટેક્સ્ટ-ટુ-સ્પીચ (TTS) ને વાયર અપ કરશો. થોડી સ્ક્રિપ્ટો, એક કે બે સેવાઓ અને કેટલાક કાળજીપૂર્વક ઑડિઓ ટ્વીક્સ ઉમેરો, અને તમારી પાસે એક પોકેટેબલ સ્માર્ટ સ્પીકર હશે જે તમારા નિયમોનું પાલન કરે છે.

ચાલો, સામાન્ય હેરાનગતિ વિના, તમને શૂન્યથી તમારા પાઇ સાથે વાત કરવા તરફ દોરીએ. અમે ભાગો, સેટઅપ, કોડ, સરખામણીઓ, ગોચા... આખું બરિટો આવરી લઈશું. 🌯

આ પછી તમને વાંચવા ગમશે તેવા લેખો:

🔗 AI નો અસરકારક રીતે અભ્યાસ કેવી રીતે કરવો
અભ્યાસ રોડમેપ બનાવો, પ્રોજેક્ટ્સનો અભ્યાસ કરો અને પ્રગતિને ટ્રેક કરો.

🔗 AI કંપની કેવી રીતે શરૂ કરવી
સમસ્યાનું મૂલ્યાંકન કરો, MVP બનાવો, ટીમ એસેમ્બલ કરો, શરૂઆતના ગ્રાહકોને સુરક્ષિત કરો.

🔗 વધુ ઉત્પાદક બનવા માટે AI નો ઉપયોગ કેવી રીતે કરવો
નિયમિત કાર્યોને સ્વચાલિત કરો, કાર્યપ્રવાહને સુવ્યવસ્થિત કરો અને સર્જનાત્મક આઉટપુટમાં વધારો કરો.

🔗 તમારા વ્યવસાયમાં AI નો સમાવેશ કેવી રીતે કરવો
ઉચ્ચ-અસરકારક પ્રક્રિયાઓ ઓળખો, પાઇલટ અમલમાં મૂકો, ROI માપો, સ્કેલ કરો.


રાસ્પબેરી પાઇ સાથે સારો DIY AI સહાયક શું બનાવે છે ✅

  • ડિફૉલ્ટ રૂપે ખાનગી - શક્ય હોય ત્યાં ઑડિઓ સ્થાનિક રાખો. ઉપકરણમાં શું બાકી રહે છે તે તમે નક્કી કરો છો.

  • મોડ્યુલર - લેગો જેવા ઘટકોને સ્વેપ કરો: વેક વર્ડ એન્જિન, ASR, LLM, TTS.

  • સસ્તું - મોટે ભાગે ઓપન સોર્સ, કોમોડિટી માઇક્સ, સ્પીકર્સ અને પાઇ.

  • હેકેબલ - હોમ ઓટોમેશન, ડેશબોર્ડ, રૂટિન, કસ્ટમ કુશળતા જોઈએ છે? સરળ.

  • વિશ્વસનીય - સેવા-વ્યવસ્થાપિત, બુટ થાય છે અને આપમેળે સાંભળવાનું શરૂ કરે છે.

  • મજા - તમે ઑડિઓ, પ્રક્રિયાઓ અને ઇવેન્ટ-આધારિત ડિઝાઇન વિશે ઘણું શીખી શકશો.

નાની ટિપ: જો તમે રાસ્પબેરી પાઇ 5 નો ઉપયોગ કરો છો અને ભારે સ્થાનિક મોડેલો ચલાવવાની યોજના બનાવો છો, તો ક્લિપ-ઓન કૂલર સતત ભાર હેઠળ મદદ કરે છે. (જ્યારે શંકા હોય, ત્યારે પાઇ 5 માટે રચાયેલ સત્તાવાર એક્ટિવ કૂલર પસંદ કરો.) [1]


તમને જોઈતા ભાગો અને સાધનો 🧰

  • રાસ્પબેરી પાઇ : હેડરૂમ માટે પાઇ 4 અથવા પાઇ 5 ની ભલામણ કરવામાં આવે છે.

  • માઇક્રોએસડી કાર્ડ : 32 જીબી+ ભલામણ કરેલ.

  • USB માઇક્રોફોન : એક સરળ USB કોન્ફરન્સ માઇક ઉત્તમ છે.

  • સ્પીકર : USB અથવા 3.5 mm સ્પીકર, અથવા I2S એમ્પ HAT.

  • નેટવર્ક : ઇથરનેટ અથવા વાઇ-ફાઇ.

  • વૈકલ્પિક સરસતા: કેસ, સક્રિય કુલર , પુશ-ટુ-ટોક માટે પુશ બટન, LED રિંગ. [1]

ઓએસ અને બેઝલાઇન સેટઅપ

  1. રાસ્પબેરી પી ઓએસ ફ્લેશ કરો . તમને જોઈતા પ્રીસેટ્સ સાથે બુટ કરી શકાય તેવું માઇક્રોએસડી મેળવવાનો આ એક સરળ રસ્તો છે. [1]

  2. બુટ કરો, નેટવર્કથી કનેક્ટ કરો, પછી પેકેજો અપડેટ કરો:

સુડો એપ્ટ અપડેટ અને સુડો એપ્ટ અપગ્રેડ -y
  1. ઑડિઓ બેઝિક્સ : Raspberry Pi OS પર તમે ડેસ્કટોપ UI અથવા raspi-config . USB અને HDMI ઑડિઓ બધા મોડેલોમાં સપોર્ટેડ છે; બ્લૂટૂથ આઉટપુટ બ્લૂટૂથવાળા મોડેલો પર ઉપલબ્ધ છે. [1]

  2. ઉપકરણો ચકાસો:

એરેકોર્ડ -l એપ્લે -l

પછી કેપ્ચર અને પ્લેબેકનું પરીક્ષણ કરો. જો સ્તરો વિચિત્ર લાગે, તો માઇકને દોષ આપતા પહેલા મિક્સર અને ડિફોલ્ટ તપાસો.

 

એઆઈ રાસ્પબેરી પાઇ

સ્થાપત્ય એક નજરમાં 🗺️

રાસ્પબેરી પાઇ ફ્લો સાથેનો એક સમજદાર આના જેવો દેખાય છે:

વેક વર્ડ → લાઇવ ઑડિઓ કૅપ્ચર → ASR ટ્રાન્સક્રિપ્શન → ઇન્ટેન્ટ હેન્ડલિંગ અથવા LLM → રિસ્પોન્સ ટેક્સ્ટ → TTS → ઑડિઓ પ્લેબેક → MQTT અથવા HTTP દ્વારા વૈકલ્પિક ક્રિયાઓ.

  • વેક વર્ડ : પોર્ક્યુપિન નાનું, સચોટ છે અને પ્રતિ-કીવર્ડ સંવેદનશીલતા નિયંત્રણ સાથે સ્થાનિક રીતે ચાલે છે. [2]

  • ASR : વ્હીસ્પર એક બહુભાષી, સામાન્ય હેતુ ધરાવતું ASR મોડેલ છે જે ~680k કલાક પર તાલીમ પામેલ છે; તે ઉચ્ચારો/પૃષ્ઠભૂમિ અવાજ માટે મજબૂત છે. ઉપકરણ પર ઉપયોગ માટે, whisper.cpp એક લીન C/C++ અનુમાન પાથ પ્રદાન કરે છે. [3][4]

  • મગજ : તમારી પસંદગી - API દ્વારા ક્લાઉડ LLM, રૂલ્સ એન્જિન, અથવા હોર્સપાવરના આધારે સ્થાનિક અનુમાન.

  • TTS : પાઇપર સ્થાનિક રીતે કુદરતી ભાષણ ઉત્પન્ન કરે છે, જે સામાન્ય હાર્ડવેર પર ઝડપી પ્રતિભાવો માટે પૂરતું ઝડપી છે. [5]


ઝડપી સરખામણી કોષ્ટક 🔎

સાધન માટે શ્રેષ્ઠ ભાવ-પ્રિય તે કેમ કામ કરે છે
શાહુડી વેક વર્ડ હંમેશા સાંભળતું ટ્રિગર મફત સ્તર + ઓછું CPU, સચોટ, સરળ બાઇન્ડિંગ્સ [2]
વ્હીસ્પર.સીપીપી પાઇ પર સ્થાનિક ASR ઓપન સોર્સ સારી ચોકસાઈ, CPU-ફ્રેન્ડલી [4]
ઝડપી-વ્હીસ્પર CPU/GPU પર ઝડપી ASR ઓપન સોર્સ CTranslate2 ઑપ્ટિમાઇઝેશન
પાઇપર ટીટીએસ સ્થાનિક ભાષણ આઉટપુટ ઓપન સોર્સ ઝડપી અવાજો, ઘણી ભાષાઓ [5]
ક્લાઉડ LLM API સમૃદ્ધ તર્ક ઉપયોગ આધારિત ભારે ગણતરીને ઓફલોડ કરે છે
નોડ-લાલ ગોઠવણી ક્રિયાઓ ઓપન સોર્સ દ્રશ્ય પ્રવાહ, MQTT મૈત્રીપૂર્ણ

સ્ટેપ-બાય-સ્ટેપ બિલ્ડ: તમારું પહેલું વૉઇસ લૂપ 🧩

આપણે વેક વર્ડ માટે પોર્ક્યુપિન, ટ્રાન્સક્રિપ્શન માટે વ્હીસ્પર, રિપ્લાય માટે હળવા "મગજ" ફંક્શન (તમારી પસંદગીના LLM થી બદલો) અને સ્પીચ માટે પાઇપરનો ઉપયોગ કરીશું. તેને ન્યૂનતમ રાખો, પછી પુનરાવર્તન કરો.

૧) ડિપેન્ડન્સી ઇન્સ્ટોલ કરો

sudo apt install -y python3-pip portaudio19-dev sox ffmpeg pip3 install sounddevice numpy
  • શાહુડી: તમારી ભાષા માટે SDK/બાઇન્ડિંગ્સ મેળવો અને ઝડપી શરૂઆત (એક્સેસ કી + કીવર્ડ સૂચિ + ઑડિઓ ફ્રેમ્સ → .પ્રોસેસ ) ને અનુસરો. [2]

  • વ્હીસ્પર (CPU-ફ્રેન્ડલી): whisper.cpp :

ગિટ ક્લોન https://github.com/ggml-org/whisper.cpp cd whisper.cpp && cmake -B બિલ્ડ && cmake --બિલ્ડ બિલ્ડ -j ./models/download-ggml-model.sh base.en ./build/bin/whisper-cli -m ./models/ggml-base.en.bin -f your.wav -otxt

ઉપરોક્ત પ્રોજેક્ટની ઝડપી શરૂઆતનું પ્રતિબિંબ પાડે છે. [4]

પાયથોન પસંદ છે? ફાસ્ટર-વ્હીસ્પર (CTranslate2) સામાન્ય CPU પર વેનીલા પાયથોન કરતાં ઘણીવાર ઝડપી હોય છે.

૨) પાઇપર ટીટીએસ સેટ કરો

git clone https://github.com/rhasspy/piper cd piper make # તમને ગમતું વૉઇસ મોડેલ ડાઉનલોડ કરો, દા.ત., en_US-amy echo "Hello there." | ./piper --model voices/en/en_US-amy-medium.onnx --output_file hello.wav aplay hello.wav

પાઇપર બહુવિધ વૉઇસ/ભાષા વિકલ્પો સાથે ઓન-ડિવાઇસ TTS માટે ડિઝાઇન કરવામાં આવ્યું છે. [5]

૩) પાયથોનમાં ન્યૂનતમ સહાયક લૂપ

ઇરાદાપૂર્વક સંકુચિત: વેક શબ્દસમૂહ (સ્ટબ) ની રાહ જુએ છે, રેકોર્ડ કરે છે, whisper.cpp , જવાબ (પ્લેસહોલ્ડર) જનરેટ કરે છે, પછી પાઇપર દ્વારા બોલે છે. તમારા મનપસંદ LLM અથવા રૂલ લોજિક સાથે પ્લેસહોલ્ડરને સ્વેપ કરો.

import os, subprocess, wave import sounddevice as sd WAKE_WORD = "hey computer" # ઉત્પાદનમાં પોર્ક્યુપિન માટે સ્વેપ [2] RECORD_SECONDS = 6 SAMPLE_RATE = 16000 CHANNELS = 1 WORKDIR = "/home/pi/assistant" ASR_BIN = "/home/pi/whisper.cpp/build/bin/whisper-cli" # [4] ASR_MODEL = "/home/pi/whisper.cpp/models/ggml-base.en.bin" PIPER_BIN = "/home/pi/piper/build/piper" # [5] PIPER_VOICE = "/home/pi/piper/voices/en/en_US-amy-medium.onnx" os.makedirs(WORKDIR, exist_ok=True) def record_wav(path, seconds=RECORD_SECONDS): audio = sd.rec(int(seconds * SAMPLE_RATE), samplerate=SAMPLE_RATE, channels=CHANNELS, dtype='int16') sd.wait() wave.open(path, 'wb') સાથે w તરીકે: w.setnchannels(CHANNELS); w.setsampwidth(2); w.setframerate(SAMPLE_RATE) w.writeframes(audio.tobytes()) def transcribe(path): cmd = [ASR_BIN, "-m", ASR_MODEL, "-f", path, "-otxt"] subprocess.run(cmd, check=True, cwd=WORKDIR) open(path.replace(".wav", ".txt"), "r", encoding="utf-8") ને f તરીકે પરત કરો: f.read().strip() def generate_reply(prompt): if "weather" in prompt.lower(): return "મને વાદળો દેખાતા નથી, પણ તે ઠીક થઈ શકે છે. જો શક્ય હોય તો જેકેટ લાવો." "તમે કહ્યું: " + પ્રોમ્પ્ટ def speak(text): proc = subprocess.Popen([PIPER_BIN, "--model", PIPER_VOICE, "--output_file", f"{WORKDIR}/reply.wav"], stdin=subprocess.PIPE) proc.stdin.write(text.encode("utf-8")); proc.stdin.close(); proc.wait() subprocess.run(["aplay", f"{WORKDIR}/reply.wav"], check=True) print("સહાયક તૈયાર છે. પરીક્ષણ કરવા માટે વેક શબ્દસમૂહ લખો.") જ્યારે સાચું: typed = input("> ").strip().lower() જો ટાઇપ કરેલ હોય તો == WAKE_WORD: wav_path = f"{WORKDIR}/input.wav" record_wav(wav_path) text = transcribe(wav_path) reply = generate_reply(text) print("User:", text); print("સહાયક:", reply) speak(reply) else: print("લૂપ ચકાસવા માટે વેક શબ્દસમૂહ લખો.")

વાસ્તવિક વેક-વર્ડ ડિટેક્શન માટે, પોર્ક્યુપાઇનના સ્ટ્રીમિંગ ડિટેક્ટર (ઓછું CPU, પ્રતિ-કીવર્ડ સંવેદનશીલતા) ને એકીકૃત કરો. [2]


ઓડિયો ટ્યુનિંગ જે ખરેખર મહત્વનું છે 🎚️

થોડા નાના સુધારાઓ તમારા સહાયકને 10× વધુ સ્માર્ટ બનાવે છે:

  • માઇકનું અંતર : ૩૦-૬૦ સેમી ઘણા USB માઇક માટે એક સારો વિકલ્પ છે.

  • સ્તરો રાસ્પી-કન્ફિગ દ્વારા આઉટપુટ ડિવાઇસ અને સ્તરોનું સંચાલન કરી શકો છો . [1]

  • રૂમ ધ્વનિશાસ્ત્ર : કઠણ દિવાલો પડઘા પેદા કરે છે; માઇક નીચે નરમ સાદડી મદદ કરે છે.

  • વેક વર્ડ થ્રેશોલ્ડ : ખૂબ સંવેદનશીલ → ઘોસ્ટ ટ્રિગર્સ; ખૂબ કડક → તમે પ્લાસ્ટિક પર બૂમો પાડશો. પોર્ક્યુપાઇન તમને દરેક કીવર્ડ પ્રત્યે સંવેદનશીલતા બદલવા દે છે. [2]

  • થર્મલ્સ : Pi 5 પર લાંબા ટ્રાન્સક્રિપ્શનને સતત કામગીરી માટે સત્તાવાર સક્રિય કુલરનો લાભ મળે છે. [1]


રમકડાથી ઉપકરણ તરફ જવું: સેવાઓ, ઓટોસ્ટાર્ટ, આરોગ્ય તપાસ 🧯

માણસો સ્ક્રિપ્ટો ચલાવવાનું ભૂલી જાય છે. કમ્પ્યુટર્સ સારા બનવાનું ભૂલી જાય છે. તમારા લૂપને મેનેજ્ડ સર્વિસમાં ફેરવો:

  1. સિસ્ટમડી યુનિટ બનાવો:

[યુનિટ] વર્ણન=DIY વોઇસ આસિસ્ટન્ટ આફ્ટર=નેટવર્ક.ટાર્ગેટ sound.ટાર્ગેટ [સેવા] યુઝર=પીઆઈ વર્કિંગડિરેક્ટરી=/હોમ/પીઆઈ/સહાયક એક્ઝેકટાર=/usr/bin/python3 /home/pi/સહાયક/સહાયક.પીઆઈ રીસ્ટાર્ટ=હંમેશા રીસ્ટાર્ટસેક=3 [ઇન્સ્ટોલ કરો] વોન્ટેડબાય=મલ્ટી-યુઝર.ટાર્ગેટ
  1. તેને સક્ષમ કરો:

sudo cp assistant.service /etc/systemd/system/ sudo systemctl ડિમન-રીલોડ sudo systemctl સક્ષમ કરો --હવે assistant.service
  1. લોગ ટેઇલ્સ:

journalctl -u સહાયક -f

હવે તે બુટ થવા પર શરૂ થાય છે, ક્રેશ થવા પર ફરી શરૂ થાય છે, અને સામાન્ય રીતે ઉપકરણની જેમ વર્તે છે. થોડું કંટાળાજનક, ઘણું સારું.


કૌશલ્ય પ્રણાલી: તેને ઘરે ખરેખર ઉપયોગી બનાવો 🏠✨

એકવાર વૉઇસ-ઇન અને વૉઇસ-આઉટ મજબૂત થઈ જાય, પછી ક્રિયાઓ ઉમેરો:

  • ઇન્ટેન્ટ રાઉટર : સામાન્ય કાર્યો માટે સરળ કીવર્ડ રૂટ્સ.

  • સ્માર્ટ હોમ : MQTT પર ઇવેન્ટ્સ પ્રકાશિત કરો અથવા હોમ આસિસ્ટન્ટના HTTP એન્ડપોઇન્ટ્સ પર કૉલ કરો.

  • પ્લગઇન્સ : ઝડપી પાયથોન ફંક્શન્સ જેમ કે set_timer , what_is_the_time , play_radio , run_scene .

ક્લાઉડ LLM લૂપમાં હોવા છતાં, ઝડપ અને વિશ્વસનીયતા માટે પહેલા સ્પષ્ટ સ્થાનિક આદેશોને રૂટ કરો.


ફક્ત સ્થાનિક વિરુદ્ધ ક્લાઉડ આસિસ્ટ: તમને લાગશે તેવો બદલાવ 🌓

ફક્ત સ્થાનિક
ફાયદા: ખાનગી, ઑફલાઇન, અનુમાનિત ખર્ચ.
ગેરફાયદા: નાના બોર્ડ પર ભારે મોડેલો ધીમા હોઈ શકે છે. વ્હિસ્પરની બહુભાષી તાલીમ જો તમે તેને ઉપકરણ પર અથવા નજીકના સર્વર પર રાખો છો તો તેને મજબૂત બનાવવામાં મદદ કરે છે. [3]

ક્લાઉડ આસિસ્ટ
ફાયદા: શક્તિશાળી તર્ક, મોટી સંદર્ભ વિંડોઝ.
ગેરફાયદા: ડેટા, ઉપકરણ, નેટવર્ક નિર્ભરતા, ચલ ખર્ચ.

એક હાઇબ્રિડ ઘણીવાર જીતે છે: વેક વર્ડ + ASR લોકલ → રિઝનિંગ માટે API કૉલ કરો → TTS લોકલ. [2][3][5]


મુશ્કેલીનિવારણ: વિચિત્ર ગ્રેમલિન્સ અને ઝડપી સુધારાઓ 👾

  • વેક વર્ડ ફોલ્સ ટ્રિગર્સ : સંવેદનશીલતા ઓછી કરો અથવા અલગ માઇક અજમાવો. [2]

  • ASR લેગ : નાના વ્હીસ્પર મોડેલનો ઉપયોગ કરો અથવા -j --config Release સાથે whisper.cpp . [4]

  • ચોપી ટીટીએસ : સામાન્ય શબ્દસમૂહો પહેલાથી જનરેટ કરો; તમારા ઓડિયો ડિવાઇસ અને સેમ્પલ રેટની પુષ્ટિ કરો.

  • કોઈ માઈક મળ્યું નથી : arecord -l અને મિક્સર્સ તપાસો.

  • થર્મલ થ્રોટલિંગ : સતત કામગીરી માટે Pi 5 પર સત્તાવાર એક્ટિવ કુલરનો ઉપયોગ કરો. [1]


સુરક્ષા અને ગોપનીયતા નોંધો જે તમારે ખરેખર વાંચવી જોઈએ 🔒

  • APT સાથે તમારા Pi ને અપડેટ રાખો.

  • જો તમે કોઈપણ ક્લાઉડ API નો ઉપયોગ કરો છો, તો તમે જે મોકલો છો તેનો લોગ કરો અને પહેલા સ્થાનિક રીતે વ્યક્તિગત બિટ્સને સંપાદિત કરવાનું વિચારો.

  • ઓછામાં ઓછા વિશેષાધિકારો સાથે સેવાઓ ચલાવો; જો જરૂરી ન હોય તો ExecStart માં sudo

  • મહેમાનો અથવા શાંત કલાકો માટે ફક્ત સ્થાનિક મોડ પ્રદાન કરો


બિલ્ડ વેરિઅન્ટ્સ: સેન્ડવિચની જેમ મિક્સ એન્ડ મેચ કરો 🥪

  • અલ્ટ્રા-લોકલ : પોર્ક્યુપિન + વ્હીસ્પર.સીપીપી + પાઇપર + સરળ નિયમો. ખાનગી અને મજબૂત. [2][4][5]

  • સ્પીડી ક્લાઉડ આસિસ્ટ : પોર્ક્યુપિન + (નાનું સ્થાનિક વ્હીસ્પર અથવા ક્લાઉડ ASR) + TTS સ્થાનિક + ક્લાઉડ LLM.

  • હોમ ઓટોમેશન સેન્ટ્રલ : રૂટિન, દ્રશ્યો અને સેન્સર માટે નોડ-રેડ અથવા હોમ આસિસ્ટન્ટ ફ્લો ઉમેરો.


ઉદાહરણ કૌશલ્ય: MQTT 💡 દ્વારા લાઇટ ચાલુ કરો

paho.mqtt.client ને mqtt તરીકે આયાત કરો MQTT_HOST = "192.168.1.10" TOPIC = "home/livingroom/light/set" def set_light(state: str): client = mqtt.Client() client.connect(MQTT_HOST, 1883, 60) payload = "ON" જો state.lower().startswith("on") નહિંતર "OFF" client.publish(TOPIC, payload, qos=1, retain=False) client.disconnect() # જો ટેક્સ્ટમાં "લાઈટ ચાલુ કરો": set_light("on")

"લિવિંગ રૂમ લેમ્પ ચાલુ કરો" જેવી વૉઇસ લાઇન ઉમેરો અને તમને જાદુગર જેવો અનુભવ થશે.


આ સ્ટેક વ્યવહારમાં કેમ કામ કરે છે 🧪

  • નાના બોર્ડ પર વેક-વર્ડ શોધવામાં શાહુડી કાર્યક્ષમ અને સચોટ છે, જે હંમેશા સાંભળવાનું શક્ય બનાવે છે. [2]

  • વ્હિસ્પરની વિશાળ, બહુભાષી તાલીમ તેને વિવિધ વાતાવરણ અને ઉચ્ચારો માટે મજબૂત બનાવે છે. [3]

  • whisper.cpp તે પાવરને ફક્ત CPU-માત્ર ઉપકરણો જેવા કે Pi પર ઉપયોગમાં લઈ શકાય તેવો રાખે છે. [4]

  • પાઇપર ક્લાઉડ TTS પર ઑડિઓ મોકલ્યા વિના પ્રતિભાવોને ઝડપી રાખે છે. [5]


ખૂબ લાંબો, વાંચ્યો નથી

whisper.cpp દ્વારા), જવાબો માટે તમારી પસંદગીના મગજ અને સ્થાનિક TTS માટે પાઇપરને જોડીને Raspberry Pi સાથે એક મોડ્યુલર, ખાનગી DIY AI સહાયક બનાવો . તેને systemd સેવા તરીકે લપેટો, ઑડિઓ ટ્યુન કરો અને MQTT અથવા HTTP ક્રિયાઓમાં વાયર કરો. તે તમારા વિચારો કરતાં સસ્તું છે, અને તેની સાથે રહેવામાં વિચિત્ર રીતે આનંદદાયક છે. [1][2][3][4][5]


સંદર્ભ

  1. રાસ્પબેરી પાઇ સોફ્ટવેર અને કૂલિંગ - રાસ્પબેરી પાઇ ઇમેજર (ડાઉનલોડ અને ઉપયોગ) અને પાઇ 5 એક્ટિવ કુલર ઉત્પાદન માહિતી

  2. પોર્ક્યુપિન વેક વર્ડ - SDK અને ક્વિક સ્ટાર્ટ (કીવર્ડ્સ, સંવેદનશીલતા, સ્થાનિક અનુમાન)

  3. વ્હીસ્પર (ASR મોડેલ) - બહુભાષી, મજબૂત ASR ને ~680,000 કલાક તાલીમ આપવામાં આવી

    • રેડફોર્ડ અને અન્ય, (વ્હીસ્પર) દ્વારા મજબૂત વાણી ઓળખ વધુ વાંચો

  4. whisper.cpp – CLI અને બિલ્ડ સ્ટેપ્સ સાથે CPU-ફ્રેન્ડલી વ્હીસ્પર ઇન્ફરન્સ

  5. પાઇપર ટીટીએસ - બહુવિધ અવાજો/ભાષાઓ સાથે ઝડપી, સ્થાનિક ન્યુરલ ટીટીએસ

અધિકૃત AI સહાયક સ્ટોર પર નવીનતમ AI શોધો

અમારા વિશે


બ્લોગ પર પાછા