உரையிலிருந்து பேச்சு AIயா?

உரையிலிருந்து பேச்சு AIயா?

உரையிலிருந்து பேச்சு AIயா?

நியாயமான கேள்வி. 

ஏனெனில் உரையிலிருந்து பேச்சு (TTS) என்பது வார்த்தைகளை ஆடியோவாக மாற்றும் குறிக்கோள் AI என்பது அந்த இலக்கை அடைய முறை

எனவே பதில்: சில நேரங்களில் ஆம், சில நேரங்களில் இல்லை , சில நேரங்களில் இது ஒரு கலப்பினமாகும், இது கருத்துப் பிரிவுகளில் மக்களை வாதிட வைக்கிறது 😅

இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:

🔗 AI-யால் வளைந்த கையெழுத்தைப் படிக்க முடியுமா?
கர்சீவ் எழுத்து மற்றும் பொதுவான வரம்புகளை AI எவ்வளவு சிறப்பாக அங்கீகரிக்கிறது.

🔗 இன்று AI எவ்வளவு துல்லியமானது?
பணிகள், தரவு மற்றும் உண்மையான பயன்பாடு முழுவதும் AI துல்லியத்தை எது பாதிக்கிறது.

🔗 AI எவ்வாறு முரண்பாடுகளைக் கண்டறிகிறது?
தரவுகளில் அசாதாரண வடிவங்களைக் கண்டறிவதற்கான எளிய விளக்கம்.

🔗 படிப்படியாக AI கற்றுக்கொள்வது எப்படி
புதிதாக AI கற்கத் தொடங்குவதற்கான நடைமுறை வழி.


"உரையிலிருந்து பேச்சுக்கு AI" என்பது ஏன் முதலில் குழப்பமாக இருக்கிறது 🤔🧩

மக்கள் எதையாவது "AI" என்று முத்திரை குத்துகிறார்கள், அது பின்வரும் உணர்வுகளைப் பெறும்போது:

  • தகவமைப்பு

  • மனிதாபிமானம் கொண்ட

  • "அது எப்படிச் செய்கிறது?"

புத்திசாலித்தனமான பொறியியலுக்கு நெருக்கமான முறைகளைப் பயன்படுத்தி "பேசின" .

"உரையிலிருந்து பேச்சு AI" என்று கேட்டால் , அவர்கள் பெரும்பாலும் என்ன சொல்கிறார்கள்:

  • "இது இயந்திர கற்றல் மாதிரியால் உருவாக்கப்பட்டதா?"

  • "தரவுகளிலிருந்து மனிதனைப் போல ஒலிக்கக் கற்றுக்கொண்டதா?"

  • "ஒரு ஜிபிஎஸ் மோசமான நாளைக் கொண்டிருப்பது போல் ஒலிக்காமல் சொற்றொடர் மற்றும் முக்கியத்துவத்தைக் கையாள முடியுமா?"

அந்த உள்ளுணர்வுகள் ஒழுக்கமானவை. சரியானவை அல்ல, ஆனால் ஒழுக்கமான நோக்கத்துடன்.

 

உரையிலிருந்து பேச்சு AI

விரைவான பதில்: பெரும்பாலான நவீன TTS AI ஆகும் - ஆனால் அனைத்தும் இல்லை ✅🔊

இதோ நடைமுறைக்கு ஏற்ற, தத்துவார்த்தமற்ற பதிப்பு:

  • பழைய / கிளாசிக் TTS : பெரும்பாலும் அல்ல (விதிகள் + சமிக்ஞை செயலாக்கம், அல்லது தைக்கப்பட்ட பதிவுகள்)

  • நவீன இயற்கை TTS : பொதுவாக AI-அடிப்படையிலான (நரம்பியல் நெட்வொர்க்குகள் / இயந்திர கற்றல்) [2]

ஒரு விரைவான “காது சோதனை” (முட்டாள்தனமாக இல்லை, ஆனால் ஒழுக்கமானது): ஒரு குரலில்

  • இயற்கை இடைநிறுத்தங்கள்

  • மென்மையான உச்சரிப்பு

  • சீரான தாளம்

  • அர்த்தத்துடன் பொருந்தக்கூடிய முக்கியத்துவம்

...இது அநேகமாக மாதிரி சார்ந்ததாக இருக்கலாம். ஒரு ஃப்ளோரசன்ட் அடித்தளத்தில் விதிமுறைகள் மற்றும் நிபந்தனைகளைப் படிக்கும் ரோபோ போலத் தெரிந்தால், அது பழைய அணுகுமுறைகளாக இருக்கலாம் (அல்லது பட்ஜெட் அமைப்பாக இருக்கலாம்... எந்தத் தீர்ப்பும் இல்லை).

சரி... உரையிலிருந்து பேச்சுக்கு AI பயன்பாடா? பல நவீன தயாரிப்புகளில், ஆம். ஆனால் ஒரு வகையாக TTS என்பது AI ஐ விட பெரியது.


ரோபோடிக் முதல் யதார்த்தம் வரை, உரையிலிருந்து பேச்சு வரை (மனித வார்த்தைகளில்) எவ்வாறு செயல்படுகிறது 🧠🗣️

பெரும்பாலான TTS அமைப்புகள் - எளிமையானவை அல்லது ஆடம்பரமானவை - இந்தக் குழாய்வழியின் சில பதிப்பைச் செய்கின்றன:

  1. உரை செயலாக்கம் ("உரையைப் பேசக்கூடியதாக மாற்றுதல்" என்றும் அழைக்கப்படுகிறது)
    "டாக்டர்" என்பதை "டாக்டர்" என்று விரிவுபடுத்துகிறது, எண்கள், நிறுத்தற்குறிகள், சுருக்கெழுத்துக்களைக் கையாளுகிறது மற்றும் பீதி அடையாமல் இருக்க முயற்சிக்கிறது.

  2. மொழியியல் பகுப்பாய்வு
    உரையை பேச்சு-y கட்டுமானத் தொகுதிகளாகப் பிரிக்கிறது ( ஃபோன்மேஸ் , சொற்களை வேறுபடுத்தும் சிறிய ஒலி அலகுகள்). இங்குதான் "பதிவு" (பெயர்ச்சொல்) vs "பதிவு" (வினைச்சொல்) ஒரு முழு தொலைக்காட்சி நிகழ்ச்சியாக மாறுகிறது.

  3. உரைநடை திட்டமிடல்
    நேரம், முக்கியத்துவம், இடைநிறுத்தங்கள், சுருதி இயக்கம் ஆகியவற்றைத் தேர்ந்தெடுக்கிறது. உரைநடை என்பது அடிப்படையில் "மனித" மற்றும் "மோனோடோன் டோஸ்டர்" ஆகியவற்றுக்கு இடையேயான வித்தியாசமாகும்.

  4. ஒலி உருவாக்கம்
    உண்மையான ஆடியோ அலைவடிவத்தை உருவாக்குகிறது.

புரோசோடி + ஒலி உருவாக்கத்தில் தோன்றும் மெல்-ஸ்பெக்ட்ரோகிராம்கள் கணித்து வோகோடரைப் பயன்படுத்தி ஆடியோவாக மாற்றுகின்றன (இன்று, அந்த வோகோடர் பெரும்பாலும் நரம்பியல் சார்ந்தது) [2].


TTS இன் முக்கிய வகைகள் (மற்றும் AI பொதுவாக தோன்றும் இடம்) 🧪🎙️

1) விதி அடிப்படையிலான / வடிவ தொகுப்பு (கிளாசிக் ரோபோடிக்)

பழைய காலத் தொகுப்பு கைவினை விதிகள் மற்றும் ஒலி மாதிரிகளைப் பயன்படுத்துகிறது. இது புரிந்துகொள்ளக்கூடியதாக இருக்கலாம்… ஆனால் பெரும்பாலும் ஒரு கண்ணியமான வேற்றுகிரகவாசி போல் ஒலிக்கிறது. 👽
இது "மோசமானது" அல்ல, இது வெவ்வேறு கட்டுப்பாடுகளுக்கு (எளிமை, கணிக்கக்கூடிய தன்மை, சிறிய சாதனக் கணக்கீடு) உகந்ததாக்கப்பட்டுள்ளது.

2) இணைப்புத் தொகுப்பு (ஆடியோ "வெட்டி ஒட்டு")

இது பதிவுசெய்யப்பட்ட பேச்சுத் துண்டுகளைப் பயன்படுத்தி அவற்றை ஒன்றாக இணைக்கிறது. இது நன்றாக ஒலிக்க முடியும், ஆனால் அது உடையக்கூடியது:

  • வித்தியாசமான பெயர்கள் அதை உடைத்துவிடும்

  • அசாதாரண தாளம் தடுமாற்றமாக ஒலிக்கக்கூடும்

  • பாணி மாற்றங்கள் கடினமானவை

3) நரம்பியல் TTS (நவீன, AI- இயக்கப்படும்)

நரம்பியல் அமைப்புகள் தரவுகளிலிருந்து வடிவங்களைக் கற்றுக்கொண்டு மென்மையான மற்றும் நெகிழ்வான பேச்சை உருவாக்குகின்றன - பெரும்பாலும் மேலே குறிப்பிடப்பட்டுள்ள மெல்-ஸ்பெக்ட்ரோகிராம் → வோகோடர் ஓட்டத்தைப் பயன்படுத்துகின்றன [2]. பொதுவாக மக்கள் "AI குரல்" என்று சொல்வது இதைத்தான்


ஒரு நல்ல TTS அமைப்பை உருவாக்குவது எது (“ஆஹா, அது உண்மையானதாகத் தெரிகிறது” என்பதற்கு அப்பால்) 🎯🔈

நீங்கள் எப்போதாவது ஒரு TTS குரலை இதுபோன்ற ஒன்றைச் சொல்லி சோதித்திருந்தால்:

"நீங்க பணத்தை திருடிட்டீங்கன்னு நான் சொல்லல."

... பின்னர் முக்கியத்துவம் எவ்வாறு அர்த்தத்தை மாற்றுகிறது என்பதைக் கேட்பது ... நீங்கள் ஏற்கனவே உண்மையான தர சோதனையில் நுழைந்துவிட்டீர்கள்: மட்டுமல்ல, நோக்கத்தையும் கைப்பற்றுகிறதா

உண்மையிலேயே நல்ல TTS அமைப்பு பின்வருவனவற்றைச் செய்யும்:

  • தெளிவு : தெளிவான மெய் எழுத்துக்கள், மென்மையான எழுத்துக்கள் இல்லை.

  • உரைநடை : அர்த்தத்துடன் பொருந்தக்கூடிய முக்கியத்துவம் மற்றும் வேகம்.

  • நிலைத்தன்மை : இது பத்தியின் நடுவில் தோராயமாக "ஆளுமைகளை மாற்றாது".

  • உச்சரிப்பு கட்டுப்பாடு : பெயர்கள், சுருக்கெழுத்துக்கள், மருத்துவச் சொற்கள், பிராண்ட் சொற்கள்

  • தாமதம் : அது ஊடாடும் தன்மை கொண்டதாக இருந்தால், மெதுவான தலைமுறை உடைந்ததாக உணர்கிறது.

  • SSML ஆதரவு (நீங்கள் தொழில்நுட்ப வல்லுநராக இருந்தால்): இடைநிறுத்தங்கள், முக்கியத்துவம் மற்றும் உச்சரிப்புக்கான குறிப்புகள் [1]

  • உரிமம் மற்றும் பயன்பாட்டு உரிமைகள் : சலிப்பூட்டும், ஆனால் அதிக ஆபத்துகள்

நல்ல TTS வெறும் "அழகான ஆடியோ" இல்லை. அது பயன்படுத்தக்கூடிய ஆடியோ . காலணிகள் போல. சில அழகாக இருக்கும், சில நடக்க நல்லது, சில இரண்டும் (அரிதான யூனிகார்ன்). 🦄


விரைவு ஒப்பீட்டு அட்டவணை: TTS “வழிகள்” (விலை நிர்ணய முயல் துளை இல்லாமல்) 📊😅

விலை மாற்றங்கள். கால்குலேட்டர்கள் மாறுகின்றன. மேலும் "இலவச அடுக்கு" விதிகள் சில நேரங்களில் ஒரு விரிதாளில் சுற்றப்பட்ட புதிர் போல எழுதப்படுகின்றன.

எனவே அடுத்த வாரம் எண்கள் நகராது என்று பாசாங்கு செய்வதற்குப் பதிலாக, இதோ இன்னும் நீடித்த பார்வை:

பாதை சிறந்தது செலவு முறை (வழக்கமானது) உதாரணங்கள் (முழுமையற்றவை)
கிளவுட் TTS APIகள் அளவிலான தயாரிப்புகள், பல மொழிகள், நம்பகத்தன்மை பெரும்பாலும் உரை அளவு மற்றும் குரல் அடுக்கு மூலம் அளவிடப்படுகிறது (எடுத்துக்காட்டாக, எழுத்துக்குறி விலை நிர்ணயம் பொதுவானது) [3] கூகிள் கிளவுட் டிடிஎஸ், அமேசான் பாலி, அஸூர் ஸ்பீச்
உள்ளூர் / ஆஃப்லைன் நரம்பியல் TTS தனியுரிமைக்கு முன்னுரிமை அளிக்கும் பணிப்பாய்வுகள், ஆஃப்லைன் பயன்பாடு, கணிக்கக்கூடிய செலவு எழுத்துக்குறி பில் இல்லை; நீங்கள் கணக்கீடு மற்றும் அமைவு நேரத்தில் "பணம் செலுத்துகிறீர்கள்" [4] பைபர், பிற சுய-ஹோஸ்ட் செய்யப்பட்ட அடுக்குகள்
கலப்பின அமைப்புகள் ஆஃப்லைன் ஃபால்பேக் + கிளவுட் தரம் தேவைப்படும் பயன்பாடுகள் இரண்டின் கலவை கிளவுட் + உள்ளூர் ஃபால்பேக்

(நீங்கள் ஒரு வழியைத் தேர்வு செய்கிறீர்கள் என்றால்: நீங்கள் ஒரு "சிறந்த குரலை" தேர்வு செய்யவில்லை என்றால், நீங்கள் ஒரு பணிப்பாய்வைத் . அதுதான் மக்கள் குறைத்து மதிப்பிடும் பகுதி.)


நவீன TTS-ல் “AI” என்றால் உண்மையில் என்ன 🧠✨

மக்கள் TTS ஐ "AI" என்று கூறும்போது, ​​அவர்கள் பொதுவாக கணினி இயந்திரக் கற்றலைப் பயன்படுத்தி இவற்றில் ஒன்று அல்லது அதற்கு மேற்பட்டவற்றைச் செய்கிறது என்று அர்த்தம்:

  • ஒலிகளின் கால அளவைக் கணிக்கவும் (ஒலிகள் எவ்வளவு காலம் நீடிக்கும்)

  • சுருதி/ஒலி வடிவங்களைக் கணிக்கவும்

  • ஒலி அம்சங்களை உருவாக்குகின்றன (பெரும்பாலும் மெல்-ஸ்பெக்ட்ரோகிராம்கள்)

  • (பெரும்பாலும் நரம்பியல்) குரல் கருவி வழியாக ஆடியோவை உருவாக்குதல்

  • சில நேரங்களில் குறைவான கட்டங்களில் (முற்றிலும் இறுதி வரை) செய்யுங்கள் [2]

முக்கியமான விஷயம்: AI TTS என்பது எழுத்துக்களை சத்தமாக வாசிப்பதில்லை. இது வேண்டுமென்றே ஒலிக்கும் அளவுக்கு பேச்சு வடிவங்களை மாதிரியாக்குகிறது.


சில TTSகள் ஏன் இன்னும் AI ஆக இல்லை - அது ஏன் "மோசமானது" அல்ல 🛠️🙂

உங்களுக்குத் தேவைப்படும்போது AI அல்லாத TTS இன்னும் சரியான தேர்வாக இருக்கலாம்:

  • சீரான, கணிக்கக்கூடிய உச்சரிப்பு

  • மிகக் குறைந்த கணக்கீட்டுத் தேவைகள்

  • சிறிய சாதனங்களில் ஆஃப்லைன் செயல்பாடு

  • ஒரு “ரோபோ குரல்” அழகியல் (ஆம், அது ஒரு விஷயம்)

மேலும்: “மனிதனை மிகவும் கவர்ந்தவை” எப்போதும் “சிறந்தவை” அல்ல. அணுகல் அம்சங்களுக்கு, தெளிவு + நிலைத்தன்மை பெரும்பாலும் நாடக நடிப்பை வெல்லும்.


TTS இருப்பதற்கு அணுகல்தன்மை சிறந்த காரணங்களில் ஒன்றாகும் ♿🔊

இந்தப் பகுதி அதன் சொந்த கவனத்தை ஈர்க்கத் தகுதியானது. TTS சக்திகள்:

  • பார்வையற்ற மற்றும் குறைந்த பார்வை கொண்ட பயனர்களுக்கான திரை வாசகர்கள்

  • டிஸ்லெக்ஸியா மற்றும் அறிவாற்றல் அணுகலுக்கான வாசிப்பு ஆதரவு

  • கைகள் வேலை செய்யும் சூழல்கள் (சமையல், பயணம், பெற்றோர் பராமரிப்பு, சைக்கிள் சங்கிலியை சரிசெய்தல்... உங்களுக்குத் தெரியும்) 🚲

இதோ ஒரு ரகசிய உண்மை: சரியான TTS கூட ஒழுங்கற்ற உள்ளடக்கத்தைச் சேமிக்க முடியாது.

நல்ல அனுபவங்கள் கட்டமைப்பைப் பொறுத்தது:

  • உண்மையான தலைப்புகள் ("தலைப்பு போல நடிக்கும் பெரிய தடிமனான உரை" அல்ல)

  • அர்த்தமுள்ள இணைப்பு உரை ("இங்கே கிளிக் செய்யவும்" அல்ல)

  • விவேகமான வாசிப்பு வரிசை

  • விளக்கமான மாற்று உரை

ஒரு பிரீமியம் AI குரல் வாசிப்பு சிக்கலான அமைப்பு இன்னும் சிக்கலாகவே உள்ளது. வெறும்... விவரிக்கப்பட்டது.


நெறிமுறைகள், குரல் குளோனிங் மற்றும் "காத்திருப்பு - அது உண்மையில் அவர்களா?" பிரச்சனை 😬📵

மக்களைப் ஆள்மாறாட்டம் செய்யப் பயன்படுத்தப்படும்போது

"குடும்ப அவசரநிலை" திட்டங்களில் மோசடி செய்பவர்கள் AI குரல் குளோனிங்கைப் பயன்படுத்தலாம் என்று நுகர்வோர் பாதுகாப்பு நிறுவனங்கள் வெளிப்படையாக எச்சரித்துள்ளன, மேலும் குரலை நம்புவதற்குப் பதிலாக நம்பகமான சேனல் மூலம் சரிபார்க்க [5].

உதவும் நடைமுறை பழக்கவழக்கங்கள் (சித்தப்பிரமை அல்ல, வெறும்... 2025):

  • இரண்டாவது சேனல் மூலம் வழக்கத்திற்கு மாறான கோரிக்கைகளைச் சரிபார்க்கவும்.

  • அவசரநிலைகளுக்கு ஒரு குடும்ப குறியீட்டு வார்த்தையை அமைக்கவும்.

  • "பழக்கமான குரலை" ஆதாரமாக கருத வேண்டாம் (எரிச்சலூட்டும், ஆனால் உண்மையானது)

நீங்கள் AI-உருவாக்கிய ஆடியோவை வெளியிட்டால்: சட்டப்பூர்வமாக கட்டாயப்படுத்தப்படாவிட்டாலும் கூட, வெளிப்படுத்தல் பெரும்பாலும் ஒரு நல்ல யோசனையாகும். மக்கள் ஏமாற்றப்படுவதை விரும்புவதில்லை. அவர்களுக்குப் பிடிக்காது.


சுழல் இல்லாமல் TTS அணுகுமுறையை எவ்வாறு தேர்வு செய்வது 🧭😄

ஒரு எளிய முடிவெடுக்கும் பாதை:

நீங்கள் விரும்பினால் கிளவுட் TTS ஐத் தேர்வுசெய்யவும்:

  • வேகமான அமைப்பு மற்றும் அளவிடுதல்

  • நிறைய மொழிகள் மற்றும் குரல்கள்

  • கண்காணிப்பு + நம்பகத்தன்மை

  • நேரடி ஒருங்கிணைப்பு வடிவங்கள்

நீங்கள் விரும்பினால் உள்ளூர்/ஆஃப்லைனைத் தேர்வுசெய்யவும்:

  • ஆஃப்லைன் பயன்பாடு

  • தனியுரிமைக்கு முன்னுரிமை அளிக்கும் பணிப்பாய்வுகள்

  • கணிக்கக்கூடிய செலவுகள்

  • முழு கட்டுப்பாடு (நீங்கள் டிங்கரிங் செய்யலாம்)

மேலும், ஒரு சிறிய உண்மை: சிறந்த கருவி பொதுவாக உங்கள் பணிப்பாய்வுக்குப் பொருந்தக்கூடிய ஒன்றாகும். மிகவும் அருமையான டெமோ கிளிப்பைக் கொண்ட ஒன்று அல்ல.


அடிக்கடி கேட்கப்படும் கேள்விகள்: “உரையிலிருந்து பேச்சுக்கு AI-ஆ?” என்று மக்கள் கேட்கும்போது பொதுவாக என்ன அர்த்தம் 💬🤖

தொலைபேசிகளிலும் உதவியாளர்களிலும் உரையிலிருந்து பேச்சு AI உள்ளதா?

பெரும்பாலும், ஆம் - குறிப்பாக இயற்கையான குரல்களுக்கு. ஆனால் சில அமைப்புகள் மொழி, சாதனம் மற்றும் செயல்திறன் தேவைகளைப் பொறுத்து முறைகளைக் கலக்கின்றன.

உரையிலிருந்து பேச்சு AI என்பது குரல் குளோனிங்கைப் போன்றதா?

இல்லை. TTS செயற்கை குரலில் உரையைப் படிக்கிறது. குரல் குளோனிங் ஒரு குறிப்பிட்ட நபரைப் பிரதிபலிக்க முயற்சிக்கிறது. வெவ்வேறு இலக்குகள், வெவ்வேறு ஆபத்து சுயவிவரம்.

AI TTS வேண்டுமென்றே உணர்ச்சிவசப்பட்டு ஒலிக்க முடியுமா?

ஆம் - சில அமைப்புகள் பாணி, முக்கியத்துவம், வேகம் மற்றும் உச்சரிப்பை வழிநடத்த உங்களை அனுமதிக்கின்றன. அந்த "கட்டுப்பாட்டு அடுக்கு" பெரும்பாலும் SSML (அல்லது விற்பனையாளர்-குறிப்பிட்ட சமமானவை) போன்ற தரநிலைகள் வழியாக செயல்படுத்தப்படுகிறது [1].

சரி... உரையிலிருந்து பேச்சு AIயா?

அது நவீனமாகவும் இயற்கையாகவும் ஒலித்தால், பெரும்பாலும் ஆம் . அது அடிப்படையானதாகவோ அல்லது பழையதாகவோ இருந்தால், ஒருவேளை இல்லாமலோ இருக்கலாம் . லேபிள் அவுட்புட்டை மட்டும் சார்ந்தது அல்ல, ஹூட்டின் கீழ் என்ன இருக்கிறது என்பதைப் பொறுத்தது.


சுருக்கமாக: உரையிலிருந்து பேச்சுக்கு AI-ஆ? 🧾✨

  • உரையிலிருந்து பேச்சுக்கு மாற்றுவதுதான் பணி : எழுதப்பட்ட உரையை பேச்சு ஒலியாக மாற்றுவது.

  • நவீன TTS-களில், குறிப்பாக யதார்த்தமான குரல்களுக்கு, AI என்பது ஒரு பொதுவான முறையாகும்

  • கேள்வி தந்திரமானது, ஏனென்றால் TTS ஐ AI உடன் அல்லது இல்லாமல் உருவாக்க முடியும் .

  • உங்களுக்குத் தேவையானதைப் பொறுத்து தேர்வு செய்யவும்: தெளிவு, கட்டுப்பாடு, தாமதம், தனியுரிமை, உரிமம்... "ஆஹா, இது மனிதனைப் போல ஒலிக்கிறது" என்று மட்டும் அல்ல

  • மேலும் இது முக்கியமானதாக இருக்கும்போது: குரல் அடிப்படையிலான கோரிக்கைகளைச் சரிபார்த்து , செயற்கை ஆடியோவை சரியான முறையில் வெளியிடுங்கள். நம்பிக்கையைப் பெறுவது கடினம், அதை எரிப்பது எளிது 🔥


குறிப்புகள்

  1. W3C - பேச்சு தொகுப்பு மார்க்அப் மொழி (SSML) பதிப்பு 1.1 - மேலும் படிக்கவும்

  2. டான் மற்றும் பலர் (2021) - நரம்பியல் பேச்சு தொகுப்பு குறித்த ஒரு ஆய்வு (arXiv PDF) - மேலும் படிக்கவும்

  3. கூகிள் கிளவுட் - உரையிலிருந்து பேச்சுக்கான விலை நிர்ணயம் - மேலும் படிக்கவும்

  4. OHF-வாய்ஸ் - பைபர் (லோக்கல் நியூரல் TTS எஞ்சின்) - மேலும் படிக்கவும்

  5. அமெரிக்க FTC - மோசடி செய்பவர்கள் "குடும்ப அவசரநிலை" திட்டங்களை மேம்படுத்த AI ஐப் பயன்படுத்துகின்றனர் - மேலும் படிக்கவும்

அதிகாரப்பூர்வ AI உதவியாளர் கடையில் சமீபத்திய AI ஐக் கண்டறியவும்.

எங்களை பற்றி

வலைப்பதிவிற்குத் திரும்பு