உங்கள் வழியைப் பின்பற்றி, உங்கள் சொந்த வன்பொருளில் இயங்கும், நீங்கள் சொல்வதைத் தவறாகக் கேட்டதால் தற்செயலாக பன்னிரண்டு அன்னாசிப்பழங்களை ஆர்டர் செய்யாத ஒரு சிறிய குரல் உதவியாளர் வேண்டுமா? ராஸ்பெர்ரி பை கொண்ட DIY AI உதவியாளர் வியக்கத்தக்க வகையில் அடையக்கூடியது, வேடிக்கையானது மற்றும் நெகிழ்வானது. நீங்கள் ஒரு விழித்தெழுந்த சொல், பேச்சு அங்கீகாரம் (ASR = தானியங்கி பேச்சு அங்கீகாரம்), இயற்கை மொழிக்கான மூளை (விதிகள் அல்லது ஒரு LLM), மற்றும் உரையிலிருந்து பேச்சு (TTS) ஆகியவற்றை இணைப்பீர்கள். சில ஸ்கிரிப்டுகள், ஒன்று அல்லது இரண்டு சேவைகள் மற்றும் சில கவனமான ஆடியோ மாற்றங்களைச் சேர்க்கவும், உங்கள் விதிகளுக்குக் கீழ்ப்படியும் ஒரு பாக்கெட் செய்யக்கூடிய ஸ்மார்ட் ஸ்பீக்கரைப் பெற்றுள்ளீர்கள்.
வழக்கமான முடியை இழுக்கும் வேலைகள் இல்லாமல் பூஜ்ஜியத்திலிருந்து டாக்கிங்-டு-யுவர்-பை வரை உங்களை அழைத்துச் செல்வோம். பாகங்கள், அமைப்பு, குறியீடு, ஒப்பீடுகள், சிறிய விஷயங்கள்... முழு பர்ரிட்டோவையும் நாங்கள் உள்ளடக்குவோம். 🌯
இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:
🔗 AI-ஐ எவ்வாறு திறம்பட படிப்பது
ஒரு படிப்பு வரைபடத்தை உருவாக்கவும், திட்டங்களைப் பயிற்சி செய்யவும் மற்றும் முன்னேற்றத்தைக் கண்காணிக்கவும்.
🔗 ஒரு AI நிறுவனத்தை எவ்வாறு தொடங்குவது
சிக்கலைச் சரிபார்க்கவும், MVP ஐ உருவாக்கவும், குழுவை ஒன்று சேர்க்கவும், ஆரம்ப வாடிக்கையாளர்களைப் பாதுகாக்கவும்.
🔗 அதிக உற்பத்தித் திறன் பெற AI-ஐ எவ்வாறு பயன்படுத்துவது
வழக்கமான பணிகளை தானியங்குபடுத்துங்கள், பணிப்பாய்வுகளை ஒழுங்குபடுத்துங்கள் மற்றும் படைப்பு வெளியீட்டை அதிகரிக்கவும்.
🔗 உங்கள் வணிகத்தில் AI ஐ எவ்வாறு இணைப்பது
அதிக தாக்கத்தை ஏற்படுத்தும் செயல்முறைகளை அடையாளம் காணவும், முன்னோடிகளை செயல்படுத்தவும், ROI ஐ அளவிடவும், அளவிடவும்.
ராஸ்பெர்ரி பை மூலம் ஒரு நல்ல DIY AI உதவியாளரை உருவாக்குவது எது ✅
-
இயல்பாகவே தனிப்பட்டது - முடிந்தவரை ஆடியோவை உள்ளூரில் வைத்திருங்கள். சாதனத்திலிருந்து என்ன வெளியேற வேண்டும் என்பதை நீங்களே முடிவு செய்யுங்கள்.
-
மாடுலர் - லெகோ போன்ற மாற்று கூறுகள்: வேக் வேர்ட் எஞ்சின், ASR, LLM, TTS.
-
மலிவு விலை - பெரும்பாலும் திறந்த மூல, பொருட்கள் மைக்குகள், ஸ்பீக்கர்கள் மற்றும் ஒரு பை.
-
ஹேக் செய்யக்கூடியது - வீட்டு ஆட்டோமேஷன், டாஷ்போர்டுகள், வழக்கமான செயல்பாடுகள், தனிப்பயன் திறன்கள் வேண்டுமா? எளிதானது.
-
நம்பகமானது - சேவையால் நிர்வகிக்கப்படுகிறது, தானாகவே துவக்கி கேட்கத் தொடங்குகிறது.
-
வேடிக்கை - ஆடியோ, செயல்முறைகள் மற்றும் நிகழ்வு சார்ந்த வடிவமைப்பு பற்றி நீங்கள் நிறைய கற்றுக்கொள்வீர்கள்.
சிறிய குறிப்பு: நீங்கள் ஒரு ராஸ்பெர்ரி பை 5 ஐப் பயன்படுத்தி, கனமான உள்ளூர் மாடல்களை இயக்க திட்டமிட்டால், ஒரு கிளிப்-ஆன் கூலர் நிலையான சுமையின் கீழ் உதவுகிறது. (சந்தேகம் இருந்தால், பை 5 க்காக வடிவமைக்கப்பட்ட அதிகாரப்பூர்வ ஆக்டிவ் கூலரைத் தேர்ந்தெடுக்கவும்.) [1]
உங்களுக்குத் தேவையான பாகங்கள் & கருவிகள் 🧰
-
ராஸ்பெர்ரி பை : ஹெட்ரூமுக்கு பை 4 அல்லது பை 5 பரிந்துரைக்கப்படுகிறது.
-
மைக்ரோ எஸ்டி கார்டு : 32 ஜிபி+ பரிந்துரைக்கப்படுகிறது.
-
USB மைக்ரோஃபோன் : ஒரு எளிய USB மாநாட்டு மைக் சிறந்தது.
-
ஸ்பீக்கர் : USB அல்லது 3.5 மிமீ ஸ்பீக்கர், அல்லது ஒரு I2S ஆம்ப் HAT.
-
நெட்வொர்க் : ஈதர்நெட் அல்லது வைஃபை.
-
விருப்பத்தேர்வுகள்: கேஸ், ஆக்டிவ் கூலர் , புஷ்-டு-டாக்கிற்கான புஷ் பட்டன், எல்இடி ரிங். [1]
OS & அடிப்படை அமைப்பு
-
ஃபிளாஷ் ராஸ்பெர்ரி பை ஓஎஸ் . நீங்கள் விரும்பும் முன்னமைவுகளுடன் துவக்கக்கூடிய மைக்ரோ எஸ்டியைப் பெறுவதற்கான நேரடியான வழி இது. [1]
-
துவக்கி, பிணையத்துடன் இணைத்து, பின்னர் தொகுப்புகளைப் புதுப்பிக்கவும்:
sudo apt புதுப்பிப்பு && sudo apt மேம்படுத்தல் -y
-
ஆடியோ அடிப்படைகள்
raspi-configவழியாக இயல்புநிலை வெளியீடு, நிலைகள் மற்றும் சாதனங்களை அமைக்கலாம் . USB மற்றும் HDMI ஆடியோ அனைத்து மாடல்களிலும் ஆதரிக்கப்படுகிறது; புளூடூத் கொண்ட மாடல்களில் புளூடூத் வெளியீடு கிடைக்கிறது. [1] -
சாதனங்களைச் சரிபார்க்கவும்:
பதிவு -l அப்லே -l
பின்னர் பிடிப்பு மற்றும் பிளேபேக்கை சோதிக்கவும். நிலைகள் வித்தியாசமாகத் தெரிந்தால், மைக்கைக் குறை கூறுவதற்கு முன்பு மிக்சர்கள் மற்றும் இயல்புநிலைகளைச் சரிபார்க்கவும்.

கட்டிடக்கலை ஒரு பார்வை 🗺️
ஒரு விவேகமான DIY AI உதவியாளர் இதுபோல் தெரிகிறது:
வேக் வேர்டு → நேரடி ஆடியோ பிடிப்பு → ASR டிரான்ஸ்கிரிப்ஷன் → நோக்கம் கையாளுதல் அல்லது LLM → பதில் உரை → TTS → ஆடியோ பிளேபேக் → MQTT அல்லது HTTP வழியாக விருப்ப செயல்கள்.
-
வேக் வேர்டு : போர்குபைன் சிறியது, துல்லியமானது, மேலும் ஒவ்வொரு முக்கிய வார்த்தைக்கும் உணர்திறன் கட்டுப்பாட்டுடன் உள்ளூரில் இயங்குகிறது. [2]
-
ASR : விஸ்பர் என்பது சுமார் 680,000 மணிநேரங்களில் பயிற்சி பெற்ற பன்மொழி, பொது நோக்கத்திற்கான ASR மாதிரி; இது உச்சரிப்புகள்/பின்னணி இரைச்சலுக்கு வலுவானது. சாதனத்தில் பயன்படுத்த,
whisper.cppஒரு மெலிந்த C/C++ அனுமான பாதையை வழங்குகிறது. [3][4] -
மூளை : உங்கள் தேர்வு - API வழியாக ஒரு கிளவுட் LLM, ஒரு விதிகள் இயந்திரம் அல்லது குதிரைத்திறனைப் பொறுத்து உள்ளூர் அனுமானம்.
-
TTS : பைபர் உள்ளூரில் இயல்பான பேச்சை உருவாக்குகிறது, மிதமான வன்பொருளில் விரைவான பதில்களுக்கு போதுமான வேகம். [5]
விரைவு ஒப்பீட்டு அட்டவணை 🔎
| கருவி | சிறந்தது | விலை அதிகம் | இது ஏன் வேலை செய்கிறது |
|---|---|---|---|
| முள்ளம்பன்றி வேக் வேர்டு | எப்போதும் கேட்கும் தூண்டுதல் | இலவச அடுக்கு + | குறைந்த CPU, துல்லியமான, எளிதான பிணைப்புகள் [2] |
| விஸ்பர்.சிபிபி | பையில் உள்ளூர் ASR | திறந்த மூல | நல்ல துல்லியம், CPU-க்கு ஏற்றது [4] |
| வேகமாக-விஸ்பர் | CPU/GPU இல் வேகமான ASR | திறந்த மூல | CTranslate2 மேம்படுத்தல்கள் |
| பைபர் டிடிஎஸ் | உள்ளூர் பேச்சு வெளியீடு | திறந்த மூல | வேகமான குரல்கள், பல மொழிகள் [5] |
| கிளவுட் LLM API | வளமான பகுத்தறிவு | பயன்பாடு சார்ந்தது | அதிக கணினியை ஏற்றுகிறது |
| முனை-சிவப்பு | செயல்களை ஒழுங்கமைத்தல் | திறந்த மூல | காட்சி ஓட்டங்கள், MQTTக்கு ஏற்றது |
படிப்படியான கட்டமைப்பு: உங்கள் முதல் குரல் வளையம் 🧩
விழித்தெழும் வார்த்தைக்கு போர்குபைன், டிரான்ஸ்கிரிப்ஷனுக்கு விஸ்பர், பதிலுக்கு இலகுரக “மூளை” செயல்பாடு (உங்கள் விருப்பப்படி LLM உடன் மாற்றவும்) மற்றும் பேச்சுக்கு பைபர் ஆகியவற்றைப் பயன்படுத்துவோம். அதை குறைந்தபட்சமாக வைத்து, பின்னர் மீண்டும் செய்யவும்.
1) சார்புகளை நிறுவவும்
sudo apt நிறுவு -y python3-pip portaudio19-dev sox ffmpeg pip3 நிறுவு ஒலி சாதன எண்பி
-
முள்ளம்பன்றி: உங்கள் மொழிக்கான SDK/பைண்டிங்ஸைப் பிடித்து, விரைவான தொடக்கத்தைப் பின்பற்றவும் (அணுகல் விசை + முக்கிய வார்த்தை பட்டியல் + ஆடியோ பிரேம்கள் →
.process). [2] -
விஸ்பர் (CPU-க்கு ஏற்றது): whisper.cpp ஐ :
git குளோன் https://github.com/ggml-org/whisper.cpp cd whisper.cpp && cmake -B build && cmake --build build -j ./models/download-ggml-model.sh base.en ./build/bin/whisper-cli -m ./models/ggml-base.en.bin -f your.wav -otxt
மேலே உள்ளவை திட்டத்தின் விரைவான தொடக்கத்தை பிரதிபலிக்கின்றன. [4]
பைத்தானை விரும்புகிறீர்களா? மிதமான CPUகளில்,
வேகமான-விஸ்பர்
2) பைபர் TTS ஐ அமைக்கவும்
git clone https://github.com/rhasspy/piper cd piper make # உங்களுக்குப் பிடித்த குரல் மாதிரியைப் பதிவிறக்கவும், எ.கா., en_US-amy echo "வணக்கம் அங்கே." | ./piper --model voices/en/en_US-amy-medium.onnx --output_file hello.wav aplay hello.wav
பைபர் பல குரல்/மொழி விருப்பங்களுடன் சாதனத்தில் உள்ள TTS க்காக வடிவமைக்கப்பட்டுள்ளது. [5]
3) பைத்தானில் ஒரு குறைந்தபட்ச உதவியாளர் வளையம்
வேண்டுமென்றே சுருக்கமாக: ஒரு விழித்தெழு சொற்றொடருக்காகக் காத்திருக்கிறது (ஸ்டப்), பதிவு செய்கிறது, whisper.cpp , ஒரு பதிலை உருவாக்குகிறது (பிளேஸ்ஹோல்டர்), பின்னர் பைபர் வழியாகப் பேசுகிறது. உங்களுக்குப் பிடித்த LLM அல்லது விதி தர்க்கத்துடன் பிளேஸ்ஹோல்டரை மாற்றுகிறது.
os, துணைச் செயல்முறை, அலை இறக்குமதி ஒலி சாதனம் sd ஆக WAKE_WORD = "ஹே கணினி" # உற்பத்தியில் போர்குபைனுக்கான இடமாற்றம் [2] RECORD_SECONDS = 6 SAMPLE_RATE = 16000 CHANNELS = 1 WORKDIR = "/home/pi/assistant" ASR_BIN = "/home/pi/whisper.cpp/build/bin/whisper-cli" # [4] ASR_MODEL = "/home/pi/whisper.cpp/models/ggml-base.en.bin" PIPER_BIN = "/home/pi/piper/build/piper" # [5] PIPER_VOICE = "/home/pi/piper/voices/en/en_US-amy-medium.onnx" os.makedirs(WORKDIR, exist_ok=True) def record_wav(path, வினாடிகள்=RECORD_SECONDS): ஆடியோ = sd.rec(int(வினாடிகள் * SAMPLE_RATE), samplerate=SAMPLE_RATE, சேனல்கள்=CHANNELS, dtype='int16') sd.wait() wave.open(path, 'wb') உடன் w: w.setnchannels(CHANNELS); w.setsampwidth(2); w.setframerate(SAMPLE_RATE) w.writeframes(audio.tobytes()) def transcribe(path): cmd = [ASR_BIN, "-m", ASR_MODEL, "-f", path, "-otxt"] subprocess.run(cmd, check=True, cwd=WORKDIR) உடன் open(path.replace(".wav", ".txt"), "r", encoding="utf-8") என f ஆக: return f.read().strip() def generate_reply(prompt): return "weather" in prompt.lower(): return "எனக்கு மேகங்களைப் பார்க்க முடியவில்லை, ஆனால் அது நன்றாக இருக்கலாம். ஒரு ஜாக்கெட்டைக் கொண்டு வாருங்கள்." "நீங்கள் சொன்னது:" + prompt def speak(text): proc = subprocess.Popen([PIPER_BIN, "--model", PIPER_VOICE, "--output_file", f"{WORKDIR}/reply.wav"], stdin=subprocess.PIPE) proc.stdin.write(text.encode("utf-8")); proc.stdin.close(); proc.wait() subprocess.run(["aplay", f"{WORKDIR}/reply.wav"], check=True) print("Assistant ready. Type the wake phrase to test.") True: typed = input("> ").strip().lower() if typeed = == WAKE_WORD: wav_path = f"{WORKDIR}/input.wav" record_wav(wav_path) text = transcribe(wav_path) reply = generate_reply(text) print("User:", text); print("Assistant:", reply) speak(reply) else: print("loop ஐ சோதிக்க wake phrase the type the wake phrase to test.")
உண்மையான விழித்தெழு-சொல் கண்டறிதலுக்கு, போர்குபைனின் ஸ்ட்ரீமிங் டிடெக்டரை ஒருங்கிணைக்கவும் (குறைந்த CPU, ஒவ்வொரு முக்கிய வார்த்தைக்கும் உணர்திறன்). [2]
உண்மையில் முக்கியமான ஆடியோ ட்யூனிங் 🎚️
சில சிறிய திருத்தங்கள் உங்கள் உதவியாளரை 10× புத்திசாலியாக உணர வைக்கின்றன:
-
மைக் தூரம் : பல USB மைக்குகளுக்கு 30–60 செ.மீ ஒரு இனிமையான இடமாகும்.
-
நிலைகள்
raspi-configவழியாக வெளியீட்டு சாதனம் மற்றும் நிலைகளை நிர்வகிக்கலாம் . [1] -
அறை ஒலியியல் : கடினமான சுவர்கள் எதிரொலிகளை ஏற்படுத்துகின்றன; மைக்கின் கீழ் ஒரு மென்மையான பாய் உதவுகிறது.
-
விழித்தெழு வார்த்தை வரம்பு : மிகவும் உணர்திறன் → பேய் தூண்டுதல்கள்; மிகவும் கண்டிப்பானது → நீங்கள் பிளாஸ்டிக்கைக் கத்துவீர்கள். போர்குபைன் ஒரு முக்கிய வார்த்தைக்கு உணர்திறனை சரிசெய்ய உங்களை அனுமதிக்கிறது. [2]
-
வெப்பப் பொருட்கள் : Pi 5 இல் உள்ள நீண்ட டிரான்ஸ்கிரிப்ஷன்கள், நிலையான செயல்திறனுக்காக அதிகாரப்பூர்வ ஆக்டிவ் கூலரிலிருந்து பயனடைகின்றன. [1]
பொம்மையிலிருந்து சாதனத்திற்கு மாறுதல்: சேவைகள், ஆட்டோஸ்டார்ட், சுகாதாரப் பரிசோதனைகள் 🧯
மனிதர்கள் ஸ்கிரிப்ட்களை இயக்க மறந்து விடுகிறார்கள். கணினிகள் நன்றாக இருக்க மறந்து விடுகின்றன. உங்கள் வளையத்தை நிர்வகிக்கப்பட்ட சேவையாக மாற்றவும்:
-
ஒரு systemd அலகை உருவாக்கவும்:
[அலகு] விளக்கம்=DIY குரல் உதவியாளர் After=network.target sound.target [சேவை] பயனர்=pi WorkingDirectory=/home/pi/assistant ExecStart=/usr/bin/python3 /home/pi/assistant/assistant.py Restart=always RestartSec=3 [Install] WantedBy=multi-user.target
-
இதை இயக்கு:
sudo cp assistant.service /etc/systemd/system/ sudo systemctl daemon-reload sudo systemctl --now assistant.service ஐ இயக்கு
-
பதிவு வால்கள்:
journalctl -u உதவியாளர் -f
இப்போது அது பூட் ஆகும்போது தொடங்குகிறது, செயலிழந்தால் மீண்டும் தொடங்குகிறது, பொதுவாக ஒரு உபகரணத்தைப் போல செயல்படுகிறது. கொஞ்சம் சலிப்பாக இருக்கிறது, மிகவும் சிறப்பாக இருக்கிறது.
திறன் அமைப்பு: வீட்டிலேயே பயனுள்ளதாக மாற்றுங்கள் 🏠✨
குரல் உள்ளீடு மற்றும் குரல் வெளியீடு உறுதியாகிவிட்டால், செயல்களைச் சேர்க்கவும்:
-
இன்டென்ட் ரூட்டர் : பொதுவான பணிகளுக்கான எளிய முக்கிய வார்த்தை வழிகள்.
-
ஸ்மார்ட் ஹோம் : நிகழ்வுகளை MQTTக்கு வெளியிடுங்கள் அல்லது வீட்டு உதவியாளரின் HTTP இறுதிப்புள்ளிகளை அழைக்கவும்.
-
செருகுநிரல்கள்
set_timer,what_is_the_time,play_radio,run_sceneபோன்ற விரைவான பைதான் செயல்பாடுகள் .
லூப்பில் ஒரு கிளவுட் LLM இருந்தாலும், வேகம் மற்றும் நம்பகத்தன்மைக்காக முதலில் தெளிவான உள்ளூர் கட்டளைகளை ரூட் செய்யவும்.
உள்ளூர் மட்டும் vs கிளவுட் அசிஸ்ட்: நீங்கள் உணரும் சமரசங்கள் 🌓
உள்ளூர் மட்டும்
நன்மைகள்: தனிப்பட்ட, ஆஃப்லைன், கணிக்கக்கூடிய செலவுகள்.
பாதகம்: சிறிய பலகைகளில் கனமான மாதிரிகள் மெதுவாக இருக்கலாம். விஸ்பரின் பன்மொழி பயிற்சி சாதனத்திலோ அல்லது அருகிலுள்ள சேவையகத்திலோ வைத்திருந்தால், அதன் வலிமைக்கு உதவுகிறது. [3]
மேக உதவி
நன்மை: சக்திவாய்ந்த பகுத்தறிவு, பெரிய சூழல் சாளரங்கள்.
பாதகம்: சாதனத்திலிருந்து தரவு வெளியேறுதல், பிணைய சார்பு, மாறி செலவுகள்.
ஒரு கலப்பினம் பெரும்பாலும் வெற்றி பெறுகிறது: வேக் வேர்டு + ASR லோக்கல் → பகுத்தறிவுக்கு ஒரு API ஐ அழைக்கவும் → TTS லோக்கல். [2][3][5]
சரிசெய்தல்: விசித்திரமான கிரெம்லின்ஸ் & விரைவு திருத்தங்கள் 👾
-
தவறான தூண்டுதல்களை எழுப்புங்கள் : உணர்திறன்களைக் குறைக்கவும் அல்லது வேறு மைக்கை முயற்சிக்கவும். [2]
-
ASR லேக் : சிறிய விஸ்பர் மாதிரியைப் பயன்படுத்தவும் அல்லது வெளியீட்டு கொடிகளுடன்
whisper.cpp ஐ-j --config வெளியீடு). [4] -
தொய்வான TTS : பொதுவான சொற்றொடர்களை முன்கூட்டியே உருவாக்குங்கள்; உங்கள் ஆடியோ சாதனம் மற்றும் மாதிரி விகிதங்களை உறுதிப்படுத்தவும்.
-
மைக் எதுவும் கண்டறியப்படவில்லை :
arecord -lமற்றும் மிக்சர்களைச் சரிபார்க்கவும். -
வெப்பத் தூண்டுதல் : நிலையான செயல்திறனுக்காக Pi 5 இல் அதிகாரப்பூர்வ ஆக்டிவ் கூலரைப் பயன்படுத்தவும். [1]
நீங்கள் உண்மையில் படிக்க வேண்டிய பாதுகாப்பு & தனியுரிமை குறிப்புகள் 🔒
-
APT உடன் உங்கள் Pi-ஐப் புதுப்பித்த நிலையில் வைத்திருங்கள்.
-
நீங்கள் ஏதேனும் கிளவுட் API ஐப் பயன்படுத்தினால், நீங்கள் அனுப்புவதைப் பதிவுசெய்து, முதலில் உள்ளூரில் தனிப்பட்ட பிட்களைத் திருத்துவதைக் கருத்தில் கொள்ளுங்கள்.
-
குறைந்தபட்ச சலுகையுடன் சேவைகளை இயக்கவும்; தேவைப்படாவிட்டால் ExecStart இல்
sudo ஐத் -
விருந்தினர்கள் அல்லது அமைதியான நேரங்களுக்கு உள்ளூர் மட்டும் பயன்முறையை வழங்கவும்
பில்ட் வகைகள்: சாண்ட்விச் போல கலந்து பொருத்தவும் 🥪
-
மிகவும் உள்ளூர் : முள்ளம்பன்றி + விஸ்பர்.சிபிபி + பைபர் + எளிய விதிகள். தனிப்பட்ட மற்றும் உறுதியான. [2][4][5]
-
வேகமான கிளவுட் உதவி : முள்ளம்பன்றி + (சிறிய உள்ளூர் விஸ்பர் அல்லது கிளவுட் ASR) + TTS லோக்கல் + கிளவுட் LLM.
-
வீட்டு ஆட்டோமேஷன் மைய : வழக்கமான செயல்பாடுகள், காட்சிகள் மற்றும் சென்சார்களுக்கு Node-RED அல்லது Home Assistant ஃப்ளோக்களைச் சேர்க்கவும்.
எடுத்துக்காட்டுத் திறன்: MQTT வழியாக விளக்குகள் எரிகின்றன 💡
paho.mqtt.client ஐ mqtt ஆக இறக்குமதி செய்யவும் MQTT_HOST = "192.168.1.10" TOPIC = "home/livingroom/light/set" def set_light(state: str): client = mqtt.Client() client.connect(MQTT_HOST, 1883, 60) payload = "ON" என்றால் state.lower().startswith("on") இல்லையெனில் "OFF" client.publish(TOPIC, payload, qos=1, retain=False) client.disconnect() # "turn on the lights" in text: set_light("on")
"வாழ்க்கை அறை விளக்கை எரியுங்கள்" போன்ற ஒரு குரல் வரியைச் சேர்த்தால், நீங்கள் ஒரு மந்திரவாதியைப் போல உணர்வீர்கள்.
இந்த அடுக்கு ஏன் நடைமுறையில் வேலை செய்கிறது 🧪
-
சிறிய பலகைகளில் விழித்தெழுந்த வார்த்தையைக் கண்டறிவதில் முள்ளம்பன்றி திறமையானது மற்றும் துல்லியமானது, இது எப்போதும் கேட்பதை சாத்தியமாக்குகிறது. [2]
-
விஸ்பரின் பெரிய, பன்மொழி பயிற்சி, மாறுபட்ட சூழல்கள் மற்றும் உச்சரிப்புகளுக்கு ஏற்றவாறு அதை வலுவாக மாற்றுகிறது. [3]
-
whisper.cpp,Pi போன்ற CPU-மட்டும் சாதனங்களில் அந்த சக்தியைப் பயன்படுத்தக்கூடியதாக வைத்திருக்கிறது. [4] -
பைபர் ஆடியோவை மேகக்கணி TTS க்கு அனுப்பாமல் பதில்களை விரைவாக வைத்திருக்கிறது. [5]
மிக நீளமாக உள்ளது, படிக்கவில்லை.
வேக் வேர்டுக்கு போர்குபைன், பதில்களுக்கு உங்கள் மூளையைத் தேர்ந்தெடுக்கும் ASR-க்கு விஸ்பர் ( whisper.cpp ராஸ்பெர்ரி பையுடன் ஒரு மாடுலர், தனிப்பட்ட DIY AI உதவியாளரை உருவாக்குங்கள் . இதை ஒரு systemd சேவையாக மடிக்கவும், MQTT அல்லது HTTP செயல்களில் ஆடியோவை டியூன் செய்யவும் மற்றும் வயரை மாற்றவும். இது நீங்கள் நினைப்பதை விட மலிவானது, மேலும் அதனுடன் வாழ்வது விந்தையானது. [1][2][3][4][5]
குறிப்புகள்
-
ராஸ்பெர்ரி பை மென்பொருள் & கூலிங் - ராஸ்பெர்ரி பை இமேஜர் (பதிவிறக்கம் & பயன்படுத்தவும்) மற்றும் பை 5 ஆக்டிவ் கூலர் தயாரிப்பு தகவல்
-
ராஸ்பெர்ரி பை இமேஜர்: மேலும் படிக்கவும்
-
ஆக்டிவ் கூலர் (பை 5): மேலும் படிக்கவும்
-
-
போர்குபைன் வேக் வேர்டு - SDK & விரைவு தொடக்கம் (முக்கிய வார்த்தைகள், உணர்திறன், உள்ளூர் அனுமானம்)
-
விஸ்பர் (ASR மாதிரி) - பன்மொழி, வலுவான ASR ~680k மணிநேர பயிற்சி பெற்றது.
-
ராட்ஃபோர்ட் மற்றும் பலர், பெரிய அளவிலான பலவீனமான மேற்பார்வை (விஸ்பர்) மூலம் வலுவான பேச்சு அங்கீகாரம்: மேலும் படிக்கவும்
-
-
whisper.cpp – CLI உடன் CPU-க்கு ஏற்ற விஸ்பர் அனுமானம் மற்றும் படிகளை உருவாக்குதல்
-
பைபர் டிடிஎஸ் - பல குரல்கள்/மொழிகளைக் கொண்ட வேகமான, உள்ளூர் நரம்பியல் டிடிஎஸ்.