உரையிலிருந்து பேச்சு AIயா?
நியாயமான கேள்வி.
ஏனெனில் உரையிலிருந்து பேச்சு (TTS) என்பது வார்த்தைகளை ஆடியோவாக மாற்றும் குறிக்கோள் AI என்பது அந்த இலக்கை அடைய முறை
எனவே பதில்: சில நேரங்களில் ஆம், சில நேரங்களில் இல்லை , சில நேரங்களில் இது ஒரு கலப்பினமாகும், இது கருத்துப் பிரிவுகளில் மக்களை வாதிட வைக்கிறது 😅
இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:
🔗 AI-யால் வளைந்த கையெழுத்தைப் படிக்க முடியுமா?
கர்சீவ் எழுத்து மற்றும் பொதுவான வரம்புகளை AI எவ்வளவு சிறப்பாக அங்கீகரிக்கிறது.
🔗 இன்று AI எவ்வளவு துல்லியமானது?
பணிகள், தரவு மற்றும் உண்மையான பயன்பாடு முழுவதும் AI துல்லியத்தை எது பாதிக்கிறது.
🔗 AI எவ்வாறு முரண்பாடுகளைக் கண்டறிகிறது?
தரவுகளில் அசாதாரண வடிவங்களைக் கண்டறிவதற்கான எளிய விளக்கம்.
🔗 படிப்படியாக AI கற்றுக்கொள்வது எப்படி
புதிதாக AI கற்கத் தொடங்குவதற்கான நடைமுறை வழி.
"உரையிலிருந்து பேச்சுக்கு AI" என்பது ஏன் முதலில் குழப்பமாக இருக்கிறது 🤔🧩
மக்கள் எதையாவது "AI" என்று முத்திரை குத்துகிறார்கள், அது பின்வரும் உணர்வுகளைப் பெறும்போது:
-
தகவமைப்பு
-
மனிதாபிமானம் கொண்ட
-
"அது எப்படிச் செய்கிறது?"
புத்திசாலித்தனமான பொறியியலுக்கு நெருக்கமான முறைகளைப் பயன்படுத்தி "பேசின" .
"உரையிலிருந்து பேச்சு AI" என்று கேட்டால் , அவர்கள் பெரும்பாலும் என்ன சொல்கிறார்கள்:
-
"இது இயந்திர கற்றல் மாதிரியால் உருவாக்கப்பட்டதா?"
-
"தரவுகளிலிருந்து மனிதனைப் போல ஒலிக்கக் கற்றுக்கொண்டதா?"
-
"ஒரு ஜிபிஎஸ் மோசமான நாளைக் கொண்டிருப்பது போல் ஒலிக்காமல் சொற்றொடர் மற்றும் முக்கியத்துவத்தைக் கையாள முடியுமா?"
அந்த உள்ளுணர்வுகள் ஒழுக்கமானவை. சரியானவை அல்ல, ஆனால் ஒழுக்கமான நோக்கத்துடன்.

விரைவான பதில்: பெரும்பாலான நவீன TTS AI ஆகும் - ஆனால் அனைத்தும் இல்லை ✅🔊
இதோ நடைமுறைக்கு ஏற்ற, தத்துவார்த்தமற்ற பதிப்பு:
-
பழைய / கிளாசிக் TTS : பெரும்பாலும் அல்ல (விதிகள் + சமிக்ஞை செயலாக்கம், அல்லது தைக்கப்பட்ட பதிவுகள்)
-
நவீன இயற்கை TTS : பொதுவாக AI-அடிப்படையிலான (நரம்பியல் நெட்வொர்க்குகள் / இயந்திர கற்றல்) [2]
ஒரு விரைவான “காது சோதனை” (முட்டாள்தனமாக இல்லை, ஆனால் ஒழுக்கமானது): ஒரு குரலில்
-
இயற்கை இடைநிறுத்தங்கள்
-
மென்மையான உச்சரிப்பு
-
சீரான தாளம்
-
அர்த்தத்துடன் பொருந்தக்கூடிய முக்கியத்துவம்
...இது அநேகமாக மாதிரி சார்ந்ததாக இருக்கலாம். ஒரு ஃப்ளோரசன்ட் அடித்தளத்தில் விதிமுறைகள் மற்றும் நிபந்தனைகளைப் படிக்கும் ரோபோ போலத் தெரிந்தால், அது பழைய அணுகுமுறைகளாக இருக்கலாம் (அல்லது பட்ஜெட் அமைப்பாக இருக்கலாம்... எந்தத் தீர்ப்பும் இல்லை).
சரி... உரையிலிருந்து பேச்சுக்கு AI பயன்பாடா? பல நவீன தயாரிப்புகளில், ஆம். ஆனால் ஒரு வகையாக TTS என்பது AI ஐ விட பெரியது.
ரோபோடிக் முதல் யதார்த்தம் வரை, உரையிலிருந்து பேச்சு வரை (மனித வார்த்தைகளில்) எவ்வாறு செயல்படுகிறது 🧠🗣️
பெரும்பாலான TTS அமைப்புகள் - எளிமையானவை அல்லது ஆடம்பரமானவை - இந்தக் குழாய்வழியின் சில பதிப்பைச் செய்கின்றன:
-
உரை செயலாக்கம் ("உரையைப் பேசக்கூடியதாக மாற்றுதல்" என்றும் அழைக்கப்படுகிறது)
"டாக்டர்" என்பதை "டாக்டர்" என்று விரிவுபடுத்துகிறது, எண்கள், நிறுத்தற்குறிகள், சுருக்கெழுத்துக்களைக் கையாளுகிறது மற்றும் பீதி அடையாமல் இருக்க முயற்சிக்கிறது. -
மொழியியல் பகுப்பாய்வு
உரையை பேச்சு-y கட்டுமானத் தொகுதிகளாகப் பிரிக்கிறது ( ஃபோன்மேஸ் , சொற்களை வேறுபடுத்தும் சிறிய ஒலி அலகுகள்). இங்குதான் "பதிவு" (பெயர்ச்சொல்) vs "பதிவு" (வினைச்சொல்) ஒரு முழு தொலைக்காட்சி நிகழ்ச்சியாக மாறுகிறது. -
உரைநடை திட்டமிடல்
நேரம், முக்கியத்துவம், இடைநிறுத்தங்கள், சுருதி இயக்கம் ஆகியவற்றைத் தேர்ந்தெடுக்கிறது. உரைநடை என்பது அடிப்படையில் "மனித" மற்றும் "மோனோடோன் டோஸ்டர்" ஆகியவற்றுக்கு இடையேயான வித்தியாசமாகும். -
ஒலி உருவாக்கம்
உண்மையான ஆடியோ அலைவடிவத்தை உருவாக்குகிறது.
புரோசோடி + ஒலி உருவாக்கத்தில் தோன்றும் மெல்-ஸ்பெக்ட்ரோகிராம்கள் கணித்து வோகோடரைப் பயன்படுத்தி ஆடியோவாக மாற்றுகின்றன (இன்று, அந்த வோகோடர் பெரும்பாலும் நரம்பியல் சார்ந்தது) [2].
TTS இன் முக்கிய வகைகள் (மற்றும் AI பொதுவாக தோன்றும் இடம்) 🧪🎙️
1) விதி அடிப்படையிலான / வடிவ தொகுப்பு (கிளாசிக் ரோபோடிக்)
பழைய காலத் தொகுப்பு கைவினை விதிகள் மற்றும் ஒலி மாதிரிகளைப் பயன்படுத்துகிறது. இது புரிந்துகொள்ளக்கூடியதாக இருக்கலாம்… ஆனால் பெரும்பாலும் ஒரு கண்ணியமான வேற்றுகிரகவாசி போல் ஒலிக்கிறது. 👽
இது "மோசமானது" அல்ல, இது வெவ்வேறு கட்டுப்பாடுகளுக்கு (எளிமை, கணிக்கக்கூடிய தன்மை, சிறிய சாதனக் கணக்கீடு) உகந்ததாக்கப்பட்டுள்ளது.
2) இணைப்புத் தொகுப்பு (ஆடியோ "வெட்டி ஒட்டு")
இது பதிவுசெய்யப்பட்ட பேச்சுத் துண்டுகளைப் பயன்படுத்தி அவற்றை ஒன்றாக இணைக்கிறது. இது நன்றாக ஒலிக்க முடியும், ஆனால் அது உடையக்கூடியது:
-
வித்தியாசமான பெயர்கள் அதை உடைத்துவிடும்
-
அசாதாரண தாளம் தடுமாற்றமாக ஒலிக்கக்கூடும்
-
பாணி மாற்றங்கள் கடினமானவை
3) நரம்பியல் TTS (நவீன, AI- இயக்கப்படும்)
நரம்பியல் அமைப்புகள் தரவுகளிலிருந்து வடிவங்களைக் கற்றுக்கொண்டு மென்மையான மற்றும் நெகிழ்வான பேச்சை உருவாக்குகின்றன - பெரும்பாலும் மேலே குறிப்பிடப்பட்டுள்ள மெல்-ஸ்பெக்ட்ரோகிராம் → வோகோடர் ஓட்டத்தைப் பயன்படுத்துகின்றன [2]. பொதுவாக மக்கள் "AI குரல்" என்று சொல்வது இதைத்தான்
ஒரு நல்ல TTS அமைப்பை உருவாக்குவது எது (“ஆஹா, அது உண்மையானதாகத் தெரிகிறது” என்பதற்கு அப்பால்) 🎯🔈
நீங்கள் எப்போதாவது ஒரு TTS குரலை இதுபோன்ற ஒன்றைச் சொல்லி சோதித்திருந்தால்:
"நீங்க பணத்தை திருடிட்டீங்கன்னு நான் சொல்லல."
... பின்னர் முக்கியத்துவம் எவ்வாறு அர்த்தத்தை மாற்றுகிறது என்பதைக் கேட்பது ... நீங்கள் ஏற்கனவே உண்மையான தர சோதனையில் நுழைந்துவிட்டீர்கள்: மட்டுமல்ல, நோக்கத்தையும் கைப்பற்றுகிறதா
உண்மையிலேயே நல்ல TTS அமைப்பு பின்வருவனவற்றைச் செய்யும்:
-
தெளிவு : தெளிவான மெய் எழுத்துக்கள், மென்மையான எழுத்துக்கள் இல்லை.
-
உரைநடை : அர்த்தத்துடன் பொருந்தக்கூடிய முக்கியத்துவம் மற்றும் வேகம்.
-
நிலைத்தன்மை : இது பத்தியின் நடுவில் தோராயமாக "ஆளுமைகளை மாற்றாது".
-
உச்சரிப்பு கட்டுப்பாடு : பெயர்கள், சுருக்கெழுத்துக்கள், மருத்துவச் சொற்கள், பிராண்ட் சொற்கள்
-
தாமதம் : அது ஊடாடும் தன்மை கொண்டதாக இருந்தால், மெதுவான தலைமுறை உடைந்ததாக உணர்கிறது.
-
SSML ஆதரவு (நீங்கள் தொழில்நுட்ப வல்லுநராக இருந்தால்): இடைநிறுத்தங்கள், முக்கியத்துவம் மற்றும் உச்சரிப்புக்கான குறிப்புகள் [1]
-
உரிமம் மற்றும் பயன்பாட்டு உரிமைகள் : சலிப்பூட்டும், ஆனால் அதிக ஆபத்துகள்
நல்ல TTS வெறும் "அழகான ஆடியோ" இல்லை. அது பயன்படுத்தக்கூடிய ஆடியோ . காலணிகள் போல. சில அழகாக இருக்கும், சில நடக்க நல்லது, சில இரண்டும் (அரிதான யூனிகார்ன்). 🦄
விரைவு ஒப்பீட்டு அட்டவணை: TTS “வழிகள்” (விலை நிர்ணய முயல் துளை இல்லாமல்) 📊😅
விலை மாற்றங்கள். கால்குலேட்டர்கள் மாறுகின்றன. மேலும் "இலவச அடுக்கு" விதிகள் சில நேரங்களில் ஒரு விரிதாளில் சுற்றப்பட்ட புதிர் போல எழுதப்படுகின்றன.
எனவே அடுத்த வாரம் எண்கள் நகராது என்று பாசாங்கு செய்வதற்குப் பதிலாக, இதோ இன்னும் நீடித்த பார்வை:
| பாதை | சிறந்தது | செலவு முறை (வழக்கமானது) | உதாரணங்கள் (முழுமையற்றவை) |
|---|---|---|---|
| கிளவுட் TTS APIகள் | அளவிலான தயாரிப்புகள், பல மொழிகள், நம்பகத்தன்மை | பெரும்பாலும் உரை அளவு மற்றும் குரல் அடுக்கு மூலம் அளவிடப்படுகிறது (எடுத்துக்காட்டாக, எழுத்துக்குறி விலை நிர்ணயம் பொதுவானது) [3] | கூகிள் கிளவுட் டிடிஎஸ், அமேசான் பாலி, அஸூர் ஸ்பீச் |
| உள்ளூர் / ஆஃப்லைன் நரம்பியல் TTS | தனியுரிமைக்கு முன்னுரிமை அளிக்கும் பணிப்பாய்வுகள், ஆஃப்லைன் பயன்பாடு, கணிக்கக்கூடிய செலவு | எழுத்துக்குறி பில் இல்லை; நீங்கள் கணக்கீடு மற்றும் அமைவு நேரத்தில் "பணம் செலுத்துகிறீர்கள்" [4] | பைபர், பிற சுய-ஹோஸ்ட் செய்யப்பட்ட அடுக்குகள் |
| கலப்பின அமைப்புகள் | ஆஃப்லைன் ஃபால்பேக் + கிளவுட் தரம் தேவைப்படும் பயன்பாடுகள் | இரண்டின் கலவை | கிளவுட் + உள்ளூர் ஃபால்பேக் |
(நீங்கள் ஒரு வழியைத் தேர்வு செய்கிறீர்கள் என்றால்: நீங்கள் ஒரு "சிறந்த குரலை" தேர்வு செய்யவில்லை என்றால், நீங்கள் ஒரு பணிப்பாய்வைத் . அதுதான் மக்கள் குறைத்து மதிப்பிடும் பகுதி.)
நவீன TTS-ல் “AI” என்றால் உண்மையில் என்ன 🧠✨
மக்கள் TTS ஐ "AI" என்று கூறும்போது, அவர்கள் பொதுவாக கணினி இயந்திரக் கற்றலைப் பயன்படுத்தி இவற்றில் ஒன்று அல்லது அதற்கு மேற்பட்டவற்றைச் செய்கிறது என்று அர்த்தம்:
-
ஒலிகளின் கால அளவைக் கணிக்கவும் (ஒலிகள் எவ்வளவு காலம் நீடிக்கும்)
-
சுருதி/ஒலி வடிவங்களைக் கணிக்கவும்
-
ஒலி அம்சங்களை உருவாக்குகின்றன (பெரும்பாலும் மெல்-ஸ்பெக்ட்ரோகிராம்கள்)
-
(பெரும்பாலும் நரம்பியல்) குரல் கருவி வழியாக ஆடியோவை உருவாக்குதல்
-
சில நேரங்களில் குறைவான கட்டங்களில் (முற்றிலும் இறுதி வரை) செய்யுங்கள் [2]
முக்கியமான விஷயம்: AI TTS என்பது எழுத்துக்களை சத்தமாக வாசிப்பதில்லை. இது வேண்டுமென்றே ஒலிக்கும் அளவுக்கு பேச்சு வடிவங்களை மாதிரியாக்குகிறது.
சில TTSகள் ஏன் இன்னும் AI ஆக இல்லை - அது ஏன் "மோசமானது" அல்ல 🛠️🙂
உங்களுக்குத் தேவைப்படும்போது AI அல்லாத TTS இன்னும் சரியான தேர்வாக இருக்கலாம்:
-
சீரான, கணிக்கக்கூடிய உச்சரிப்பு
-
மிகக் குறைந்த கணக்கீட்டுத் தேவைகள்
-
சிறிய சாதனங்களில் ஆஃப்லைன் செயல்பாடு
-
ஒரு “ரோபோ குரல்” அழகியல் (ஆம், அது ஒரு விஷயம்)
மேலும்: “மனிதனை மிகவும் கவர்ந்தவை” எப்போதும் “சிறந்தவை” அல்ல. அணுகல் அம்சங்களுக்கு, தெளிவு + நிலைத்தன்மை பெரும்பாலும் நாடக நடிப்பை வெல்லும்.
TTS இருப்பதற்கு அணுகல்தன்மை சிறந்த காரணங்களில் ஒன்றாகும் ♿🔊
இந்தப் பகுதி அதன் சொந்த கவனத்தை ஈர்க்கத் தகுதியானது. TTS சக்திகள்:
-
பார்வையற்ற மற்றும் குறைந்த பார்வை கொண்ட பயனர்களுக்கான திரை வாசகர்கள்
-
டிஸ்லெக்ஸியா மற்றும் அறிவாற்றல் அணுகலுக்கான வாசிப்பு ஆதரவு
-
கைகள் வேலை செய்யும் சூழல்கள் (சமையல், பயணம், பெற்றோர் பராமரிப்பு, சைக்கிள் சங்கிலியை சரிசெய்தல்... உங்களுக்குத் தெரியும்) 🚲
இதோ ஒரு ரகசிய உண்மை: சரியான TTS கூட ஒழுங்கற்ற உள்ளடக்கத்தைச் சேமிக்க முடியாது.
நல்ல அனுபவங்கள் கட்டமைப்பைப் பொறுத்தது:
-
உண்மையான தலைப்புகள் ("தலைப்பு போல நடிக்கும் பெரிய தடிமனான உரை" அல்ல)
-
அர்த்தமுள்ள இணைப்பு உரை ("இங்கே கிளிக் செய்யவும்" அல்ல)
-
விவேகமான வாசிப்பு வரிசை
-
விளக்கமான மாற்று உரை
ஒரு பிரீமியம் AI குரல் வாசிப்பு சிக்கலான அமைப்பு இன்னும் சிக்கலாகவே உள்ளது. வெறும்... விவரிக்கப்பட்டது.
நெறிமுறைகள், குரல் குளோனிங் மற்றும் "காத்திருப்பு - அது உண்மையில் அவர்களா?" பிரச்சனை 😬📵
மக்களைப் ஆள்மாறாட்டம் செய்யப் பயன்படுத்தப்படும்போது
"குடும்ப அவசரநிலை" திட்டங்களில் மோசடி செய்பவர்கள் AI குரல் குளோனிங்கைப் பயன்படுத்தலாம் என்று நுகர்வோர் பாதுகாப்பு நிறுவனங்கள் வெளிப்படையாக எச்சரித்துள்ளன, மேலும் குரலை நம்புவதற்குப் பதிலாக நம்பகமான சேனல் மூலம் சரிபார்க்க [5].
உதவும் நடைமுறை பழக்கவழக்கங்கள் (சித்தப்பிரமை அல்ல, வெறும்... 2025):
-
இரண்டாவது சேனல் மூலம் வழக்கத்திற்கு மாறான கோரிக்கைகளைச் சரிபார்க்கவும்.
-
அவசரநிலைகளுக்கு ஒரு குடும்ப குறியீட்டு வார்த்தையை அமைக்கவும்.
-
"பழக்கமான குரலை" ஆதாரமாக கருத வேண்டாம் (எரிச்சலூட்டும், ஆனால் உண்மையானது)
நீங்கள் AI-உருவாக்கிய ஆடியோவை வெளியிட்டால்: சட்டப்பூர்வமாக கட்டாயப்படுத்தப்படாவிட்டாலும் கூட, வெளிப்படுத்தல் பெரும்பாலும் ஒரு நல்ல யோசனையாகும். மக்கள் ஏமாற்றப்படுவதை விரும்புவதில்லை. அவர்களுக்குப் பிடிக்காது.
சுழல் இல்லாமல் TTS அணுகுமுறையை எவ்வாறு தேர்வு செய்வது 🧭😄
ஒரு எளிய முடிவெடுக்கும் பாதை:
நீங்கள் விரும்பினால் கிளவுட் TTS ஐத் தேர்வுசெய்யவும்:
-
வேகமான அமைப்பு மற்றும் அளவிடுதல்
-
நிறைய மொழிகள் மற்றும் குரல்கள்
-
கண்காணிப்பு + நம்பகத்தன்மை
-
நேரடி ஒருங்கிணைப்பு வடிவங்கள்
நீங்கள் விரும்பினால் உள்ளூர்/ஆஃப்லைனைத் தேர்வுசெய்யவும்:
-
ஆஃப்லைன் பயன்பாடு
-
தனியுரிமைக்கு முன்னுரிமை அளிக்கும் பணிப்பாய்வுகள்
-
கணிக்கக்கூடிய செலவுகள்
-
முழு கட்டுப்பாடு (நீங்கள் டிங்கரிங் செய்யலாம்)
மேலும், ஒரு சிறிய உண்மை: சிறந்த கருவி பொதுவாக உங்கள் பணிப்பாய்வுக்குப் பொருந்தக்கூடிய ஒன்றாகும். மிகவும் அருமையான டெமோ கிளிப்பைக் கொண்ட ஒன்று அல்ல.
அடிக்கடி கேட்கப்படும் கேள்விகள்: “உரையிலிருந்து பேச்சுக்கு AI-ஆ?” என்று மக்கள் கேட்கும்போது பொதுவாக என்ன அர்த்தம் 💬🤖
தொலைபேசிகளிலும் உதவியாளர்களிலும் உரையிலிருந்து பேச்சு AI உள்ளதா?
பெரும்பாலும், ஆம் - குறிப்பாக இயற்கையான குரல்களுக்கு. ஆனால் சில அமைப்புகள் மொழி, சாதனம் மற்றும் செயல்திறன் தேவைகளைப் பொறுத்து முறைகளைக் கலக்கின்றன.
உரையிலிருந்து பேச்சு AI என்பது குரல் குளோனிங்கைப் போன்றதா?
இல்லை. TTS செயற்கை குரலில் உரையைப் படிக்கிறது. குரல் குளோனிங் ஒரு குறிப்பிட்ட நபரைப் பிரதிபலிக்க முயற்சிக்கிறது. வெவ்வேறு இலக்குகள், வெவ்வேறு ஆபத்து சுயவிவரம்.
AI TTS வேண்டுமென்றே உணர்ச்சிவசப்பட்டு ஒலிக்க முடியுமா?
ஆம் - சில அமைப்புகள் பாணி, முக்கியத்துவம், வேகம் மற்றும் உச்சரிப்பை வழிநடத்த உங்களை அனுமதிக்கின்றன. அந்த "கட்டுப்பாட்டு அடுக்கு" பெரும்பாலும் SSML (அல்லது விற்பனையாளர்-குறிப்பிட்ட சமமானவை) போன்ற தரநிலைகள் வழியாக செயல்படுத்தப்படுகிறது [1].
சரி... உரையிலிருந்து பேச்சு AIயா?
அது நவீனமாகவும் இயற்கையாகவும் ஒலித்தால், பெரும்பாலும் ஆம் . அது அடிப்படையானதாகவோ அல்லது பழையதாகவோ இருந்தால், ஒருவேளை இல்லாமலோ இருக்கலாம் . லேபிள் அவுட்புட்டை மட்டும் சார்ந்தது அல்ல, ஹூட்டின் கீழ் என்ன இருக்கிறது என்பதைப் பொறுத்தது.
சுருக்கமாக: உரையிலிருந்து பேச்சுக்கு AI-ஆ? 🧾✨
-
உரையிலிருந்து பேச்சுக்கு மாற்றுவதுதான் பணி : எழுதப்பட்ட உரையை பேச்சு ஒலியாக மாற்றுவது.
-
நவீன TTS-களில், குறிப்பாக யதார்த்தமான குரல்களுக்கு, AI என்பது ஒரு பொதுவான முறையாகும்
-
கேள்வி தந்திரமானது, ஏனென்றால் TTS ஐ AI உடன் அல்லது இல்லாமல் உருவாக்க முடியும் .
-
உங்களுக்குத் தேவையானதைப் பொறுத்து தேர்வு செய்யவும்: தெளிவு, கட்டுப்பாடு, தாமதம், தனியுரிமை, உரிமம்... "ஆஹா, இது மனிதனைப் போல ஒலிக்கிறது" என்று மட்டும் அல்ல
-
மேலும் இது முக்கியமானதாக இருக்கும்போது: குரல் அடிப்படையிலான கோரிக்கைகளைச் சரிபார்த்து , செயற்கை ஆடியோவை சரியான முறையில் வெளியிடுங்கள். நம்பிக்கையைப் பெறுவது கடினம், அதை எரிப்பது எளிது 🔥
குறிப்புகள்
-
W3C - பேச்சு தொகுப்பு மார்க்அப் மொழி (SSML) பதிப்பு 1.1 - மேலும் படிக்கவும்
-
டான் மற்றும் பலர் (2021) - நரம்பியல் பேச்சு தொகுப்பு குறித்த ஒரு ஆய்வு (arXiv PDF) - மேலும் படிக்கவும்
-
கூகிள் கிளவுட் - உரையிலிருந்து பேச்சுக்கான விலை நிர்ணயம் - மேலும் படிக்கவும்
-
OHF-வாய்ஸ் - பைபர் (லோக்கல் நியூரல் TTS எஞ்சின்) - மேலும் படிக்கவும்
-
அமெரிக்க FTC - மோசடி செய்பவர்கள் "குடும்ப அவசரநிலை" திட்டங்களை மேம்படுத்த AI ஐப் பயன்படுத்துகின்றனர் - மேலும் படிக்கவும்