ನಿಮ್ಮ ನೆಚ್ಚಿನ ಪಾತ್ರವು ನಿಮ್ಮೊಂದಿಗೆ ಮಾತನಾಡುವುದನ್ನು ನೀವು ಎಂದಾದರೂ ಕೇಳಲು ಬಯಸಿದ್ದೀರಾ? ಯಂತ್ರ ಕಲಿಕೆಯ ಸಹಾಯದಿಂದ ನೈಸರ್ಗಿಕ ಧ್ವನಿಯ ಪಠ್ಯದಿಂದ ಭಾಷಣವು ನಿಧಾನವಾಗಿ ರಿಯಾಲಿಟಿ ಆಗುತ್ತಿದೆ.
ಉದಾಹರಣೆಗೆ, Google ನ NAT TTS ಮಾದರಿಯನ್ನು ಅವರ ಹೊಸ ಶಕ್ತಿಗಾಗಿ ಬಳಸಲಾಗುತ್ತಿದೆ ಕಸ್ಟಮ್ ಧ್ವನಿ ಸೇವೆ. ಈ ಸೇವೆಯು ರೆಕಾರ್ಡಿಂಗ್ಗಳಿಂದ ತರಬೇತಿ ಪಡೆದ ಧ್ವನಿಯನ್ನು ರಚಿಸಲು ನರ ನೆಟ್ವರ್ಕ್ಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಉದಾಹರಣೆಗೆ ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ಗಳು ಉಬರ್ಡಕ್ ನಿಮ್ಮ ಸ್ವಂತ ಸಂಶ್ಲೇಷಿತ ಪಠ್ಯವನ್ನು ರಚಿಸಲು ನೀವು ಆಯ್ಕೆ ಮಾಡಲು ನೂರಾರು ಧ್ವನಿಗಳನ್ನು ಒದಗಿಸಿ.
ಈ ಲೇಖನದಲ್ಲಿ, 15.ai ಎಂದು ಕರೆಯಲ್ಪಡುವ ಪ್ರಭಾವಶಾಲಿ ಮತ್ತು ಅಷ್ಟೇ ನಿಗೂಢ AI ಮಾದರಿಯನ್ನು ನಾವು ನೋಡುತ್ತೇವೆ. ಅನಾಮಧೇಯ ಡೆವಲಪರ್ನಿಂದ ರಚಿಸಲಾಗಿದೆ, ಇದು ಅತ್ಯಂತ ಪರಿಣಾಮಕಾರಿ ಮತ್ತು ಭಾವನಾತ್ಮಕವಾಗಿರಬಹುದು ಪಠ್ಯದಿಂದ ಭಾಷಣ ಮಾದರಿಗಳು ಇಲ್ಲಿಯವರೆಗೆ.
15.AI ಎಂದರೇನು?
15.AI AI ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಆಗಿದ್ದು ಅದು ಭಾವನಾತ್ಮಕ ಉನ್ನತ-ನಿಷ್ಠೆಯ ಪಠ್ಯದಿಂದ ಭಾಷಣದ ಧ್ವನಿಗಳನ್ನು ಉತ್ಪಾದಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ. ಬಳಕೆದಾರರು ಸ್ಪಾಂಗೆಬಾಬ್ ಸ್ಕ್ವೇರ್ಪ್ಯಾಂಟ್ಸ್ನಿಂದ 9000 ರಿಂದ HAL 2001 ವರೆಗೆ ವಿವಿಧ ಧ್ವನಿಗಳಿಂದ ಆಯ್ಕೆ ಮಾಡಬಹುದು: ಎ ಸ್ಪೇಸ್ ಒಡಿಸ್ಸಿ.
ಈ ಕಾರ್ಯಕ್ರಮವನ್ನು ಅನಾಮಧೇಯ ಮಾಜಿ MIT ಸಂಶೋಧಕರು 15 ಎಂಬ ಹೆಸರಿನಲ್ಲಿ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದಾರೆ. ಈ ಯೋಜನೆಯನ್ನು ಆರಂಭದಲ್ಲಿ ವಿಶ್ವವಿದ್ಯಾನಿಲಯದ ಪದವಿಪೂರ್ವ ಸಂಶೋಧನಾ ಅವಕಾಶಗಳ ಕಾರ್ಯಕ್ರಮದ ಭಾಗವಾಗಿ ಕಲ್ಪಿಸಲಾಗಿದೆ ಎಂದು ಡೆವಲಪರ್ ಹೇಳಿದ್ದಾರೆ.
15.ai ನಲ್ಲಿ ಲಭ್ಯವಿರುವ ಹಲವು ಧ್ವನಿಗಳು ಮೈ ಲಿಟಲ್ ಪೋನಿ: ಫ್ರೆಂಡ್ಶಿಪ್ ಈಸ್ ಮ್ಯಾಜಿಕ್ನಿಂದ ಪಾತ್ರಗಳ ಸಾರ್ವಜನಿಕ ಡೇಟಾಸೆಟ್ಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದಿವೆ. ಕಾರ್ಯಕ್ರಮದ ಕಟ್ಟಾ ಅಭಿಮಾನಿಗಳು ತಮ್ಮ ನೆಚ್ಚಿನ ಪಾತ್ರಗಳ ನಿಖರವಾದ ಪಠ್ಯದಿಂದ ಭಾಷಣ ಜನರೇಟರ್ಗಳನ್ನು ರಚಿಸುವ ಗುರಿಯೊಂದಿಗೆ ಗಂಟೆಗಳ ಸಂವಾದವನ್ನು ಸಂಗ್ರಹಿಸಲು, ಲಿಪ್ಯಂತರಿಸಲು ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಸಹಯೋಗದ ಪ್ರಯತ್ನವನ್ನು ರೂಪಿಸಿದ್ದಾರೆ.
15.AI ಏನು ಮಾಡಬಹುದು?
15.ai ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ಮಾದರಿಯು ತರಬೇತಿ ಪಡೆದಿರುವ ಡಜನ್ಗಟ್ಟಲೆ ಕಾಲ್ಪನಿಕ ಪಾತ್ರಗಳಲ್ಲಿ ಒಂದನ್ನು ಆಯ್ಕೆ ಮಾಡುವ ಮೂಲಕ ಮತ್ತು ಇನ್ಪುಟ್ ಪಠ್ಯವನ್ನು ಸಲ್ಲಿಸುವ ಮೂಲಕ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ರಚಿಸು ಕ್ಲಿಕ್ ಮಾಡಿದ ನಂತರ, ಬಳಕೆದಾರರು ನೀಡಿದ ಸಾಲುಗಳನ್ನು ಮಾತನಾಡುವ ಕಾಲ್ಪನಿಕ ಪಾತ್ರದ ಮೂರು ಆಡಿಯೊ ಕ್ಲಿಪ್ಗಳನ್ನು ಸ್ವೀಕರಿಸಬೇಕು.
ರಿಂದ ಆಳವಾದ ಕಲಿಕೆ ಬಳಸಿದ ಮಾದರಿಯು ಅನಿರ್ದಿಷ್ಟವಾಗಿದೆ, 15.ai ಪ್ರತಿ ಬಾರಿಯೂ ಸ್ವಲ್ಪ ವಿಭಿನ್ನವಾದ ಭಾಷಣವನ್ನು ನೀಡುತ್ತದೆ. ಸರಿಯಾದ ವಿತರಣೆಯನ್ನು ಪಡೆಯಲು ಒಬ್ಬ ನಟನಿಗೆ ಹೇಗೆ ಬಹು ಟೇಕ್ಗಳು ಬೇಕಾಗಬಹುದು ಎಂಬುದರಂತೆಯೇ, ಬಳಕೆದಾರರು ಅವರು ಇಷ್ಟಪಡುವ ಔಟ್ಪುಟ್ ಅನ್ನು ಕಂಡುಕೊಳ್ಳುವವರೆಗೆ 15.ai ಪ್ರತಿ ಬಾರಿ ವಿಭಿನ್ನ ವಿತರಣಾ ಶೈಲಿಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.
ಯೋಜನೆಯು ವಿಶಿಷ್ಟವಾದ ವೈಶಿಷ್ಟ್ಯವನ್ನು ಒಳಗೊಂಡಿದೆ, ಅದು ಬಳಕೆದಾರರಿಗೆ ಭಾವನಾತ್ಮಕ ಸಂದರ್ಭೋಚಿತತೆಯನ್ನು ಬಳಸಿಕೊಂಡು ರಚಿಸಲಾದ ರೇಖೆಯ ಭಾವನೆಯನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ಬದಲಾಯಿಸಲು ಅನುಮತಿಸುತ್ತದೆ. ಈ ನಿಯತಾಂಕಗಳು MIT ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಬಳಕೆದಾರ-ಇನ್ಪುಟ್ ಎಮೋಜಿಗಳ ಭಾವನೆಯನ್ನು ಕಳೆಯಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ ದೀಪ್ಮೋಜಿ ಮಾದರಿ.
ಡೆವಲಪರ್ ಪ್ರಕಾರ, ಇತರ ರೀತಿಯ TTS ಕಾರ್ಯಕ್ರಮಗಳಿಂದ 15.ai ಅನ್ನು ಪ್ರತ್ಯೇಕಿಸುತ್ತದೆ ಎಂದರೆ "ಭಾವನೆಗಳು ಮತ್ತು ಸಹಜತೆಯನ್ನು ಹಾಗೇ ಇರಿಸಿಕೊಂಡು" ಧ್ವನಿಗಳನ್ನು ನಿಖರವಾಗಿ ಕ್ಲೋನ್ ಮಾಡಲು ಮಾದರಿಯು ಕಡಿಮೆ ಡೇಟಾವನ್ನು ಅವಲಂಬಿಸಿದೆ.
15.ai ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ?
15.ai ಹಿಂದಿನ ತಂತ್ರಜ್ಞಾನವನ್ನು ನೋಡೋಣ.
ಮೊದಲನೆಯದಾಗಿ, 15.ai ನ ಮುಖ್ಯ ಡೆವಲಪರ್, ಪ್ರೋಗ್ರಾಂ ವಿಭಿನ್ನ ಭಾವನೆಗಳ ಸ್ಥಿತಿಗಳೊಂದಿಗೆ ಧ್ವನಿಗಳನ್ನು ರಚಿಸಲು ಕಸ್ಟಮ್ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ ಎಂದು ಹೇಳುತ್ತಾರೆ. ಲೇಖಕರು ಯೋಜನೆಯ ಕುರಿತು ವಿವರವಾದ ಕಾಗದವನ್ನು ಇನ್ನೂ ಪ್ರಕಟಿಸದ ಕಾರಣ, ತೆರೆಮರೆಯಲ್ಲಿ ಏನು ನಡೆಯುತ್ತಿದೆ ಎಂಬುದರ ಕುರಿತು ನಾವು ವಿಶಾಲವಾದ ಊಹೆಗಳನ್ನು ಮಾತ್ರ ಮಾಡಬಹುದು.
ದೂರವಾಣಿಗಳನ್ನು ಹಿಂಪಡೆಯಲಾಗುತ್ತಿದೆ
ಮೊದಲಿಗೆ, ಪ್ರೋಗ್ರಾಂ ಇನ್ಪುಟ್ ಪಠ್ಯವನ್ನು ಹೇಗೆ ಪಾರ್ಸ್ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ನೋಡೋಣ. ಪ್ರೋಗ್ರಾಂ ಭಾಷಣವನ್ನು ರಚಿಸುವ ಮೊದಲು, ಅದು ಪ್ರತಿಯೊಂದು ಪದವನ್ನು ಅದರ ಫೋನೆಮ್ಗಳ ಸಂಗ್ರಹವಾಗಿ ಪರಿವರ್ತಿಸಬೇಕು. ಉದಾಹರಣೆಗೆ, "ನಾಯಿ" ಎಂಬ ಪದವು ಮೂರು ಫೋನೆಮ್ಗಳಿಂದ ಕೂಡಿದೆ: /d/, /ɒ/, ಮತ್ತು /ɡ/.
ಆದರೆ ಪ್ರತಿ ಪದಕ್ಕೆ ಯಾವ ಫೋನೆಮ್ಗಳನ್ನು ಬಳಸಬೇಕೆಂದು 15.ai ಹೇಗೆ ತಿಳಿಯುತ್ತದೆ?
15.ai ನ ಬಗ್ಗೆ ಪುಟದ ಪ್ರಕಾರ, ಪ್ರೋಗ್ರಾಂ ನಿಘಂಟು ಲುಕಪ್ ಟೇಬಲ್ ಅನ್ನು ಬಳಸುತ್ತದೆ. ಟೇಬಲ್ ಆಕ್ಸ್ಫರ್ಡ್ ಡಿಕ್ಷನರೀಸ್ API, ವಿಕ್ಷನರಿ ಮತ್ತು CMU ಉಚ್ಛಾರಣೆ ನಿಘಂಟನ್ನು ಮೂಲಗಳಾಗಿ ಬಳಸುತ್ತದೆ. 15.ai ಹೊಸದಾಗಿ ರಚಿಸಲಾದ ಪದಗಳು ಮತ್ತು ಪದಗುಚ್ಛಗಳಿಗೆ ಮೂಲವಾಗಿ ರೆಡ್ಡಿಟ್ ಮತ್ತು ಅರ್ಬನ್ ಡಿಕ್ಷನರಿಯಂತಹ ಇತರ ವೆಬ್ಸೈಟ್ಗಳನ್ನು ಬಳಸುತ್ತದೆ.
ನಿಘಂಟಿನಲ್ಲಿ ಯಾವುದೇ ಪದವು ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದಿದ್ದರೆ, ಅದರ ಉಚ್ಚಾರಣೆಯನ್ನು ಮಾದರಿಯು ಕಲಿತ ಫೋನಾಲಾಜಿಕಲ್ ನಿಯಮಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಕಳೆಯಲಾಗುತ್ತದೆ. ಲಿಬ್ರಿಟಿಟಿಎಸ್ ಡೇಟಾಸೆಟ್. ಈ ಡೇಟಾಸೆಟ್ ಕಾರ್ಪಸ್ ಆಗಿದೆ-ಸ್ಥಳೀಯ ಭಾಷೆ ಅಥವಾ ಆಡುಭಾಷೆಯಲ್ಲಿ ಬರೆಯುವ ಅಥವಾ ಮಾತನಾಡುವ ಪದಗಳ ಡೇಟಾಸೆಟ್ - ಸರಿಸುಮಾರು 585 ಗಂಟೆಗಳ ಜನರು ಇಂಗ್ಲಿಷ್ ಮಾತನಾಡುತ್ತಾರೆ.
ಭಾವನೆಗಳನ್ನು ಎಂಬೆಡಿಂಗ್
ಡೆವಲಪರ್ ಪ್ರಕಾರ, ಮಾದರಿಯು ಇನ್ಪುಟ್ ಪಠ್ಯದ ಗ್ರಹಿಸಿದ ಭಾವನೆಯನ್ನು ಊಹಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ. ಮಾದರಿಯು ಈ ಕಾರ್ಯವನ್ನು DeepMoji ಮೂಲಕ ಸಾಧಿಸುತ್ತದೆ ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ ಮಾದರಿ. ಭಾವನೆಗಳನ್ನು ವ್ಯಕ್ತಪಡಿಸಲು ಭಾಷೆಯನ್ನು ಹೇಗೆ ಬಳಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಗುರಿಯೊಂದಿಗೆ ಈ ನಿರ್ದಿಷ್ಟ ಮಾದರಿಯು ಎಮೋಜಿಗಳೊಂದಿಗೆ ಶತಕೋಟಿ ಟ್ವೀಟ್ಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದಿದೆ. ಅಪೇಕ್ಷಿತ ಭಾವನೆಯ ಕಡೆಗೆ ಔಟ್ಪುಟ್ ಅನ್ನು ಕುಶಲತೆಯಿಂದ ನಿರ್ವಹಿಸಲು ಮಾದರಿಯ ಫಲಿತಾಂಶವನ್ನು TTS ಮಾದರಿಯಲ್ಲಿ ಹುದುಗಿಸಲಾಗಿದೆ.
ಇನ್ಪುಟ್ ಪಠ್ಯದಿಂದ ಫೋನೆಮ್ಗಳು ಮತ್ತು ಭಾವನೆಗಳನ್ನು ಹೊರತೆಗೆದ ನಂತರ, ಈಗ ಭಾಷಣವನ್ನು ಸಂಶ್ಲೇಷಿಸುವ ಸಮಯ.
ಧ್ವನಿ ಕ್ಲೋನಿಂಗ್ ಮತ್ತು ಸಂಶ್ಲೇಷಣೆ
15.ai ನಂತಹ ಪಠ್ಯದಿಂದ ಭಾಷಣದ ಮಾದರಿಗಳನ್ನು ಬಹು-ಸ್ಪೀಕರ್ ಮಾದರಿಗಳು ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ವಿಭಿನ್ನ ಧ್ವನಿಗಳಲ್ಲಿ ಹೇಗೆ ಮಾತನಾಡಬೇಕೆಂದು ಕಲಿಯಲು ಸಾಧ್ಯವಾಗುವಂತೆ ಈ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲಾಗಿದೆ. ನಮ್ಮ ಮಾದರಿಯನ್ನು ಸರಿಯಾಗಿ ತರಬೇತಿ ಮಾಡಲು, ಅನನ್ಯ ಧ್ವನಿ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಹೊರತೆಗೆಯಲು ಮತ್ತು ಕಂಪ್ಯೂಟರ್ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ರೀತಿಯಲ್ಲಿ ಅದನ್ನು ಪ್ರತಿನಿಧಿಸಲು ನಾವು ಒಂದು ಮಾರ್ಗವನ್ನು ಕಂಡುಹಿಡಿಯಬೇಕು. ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಸ್ಪೀಕರ್ ಎಂಬೆಡಿಂಗ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಪ್ರಸ್ತುತ ಪಠ್ಯದಿಂದ ಭಾಷಣದ ಮಾದರಿಗಳನ್ನು ಬಳಸುತ್ತದೆ ನರಮಂಡಲ ಜಾಲಗಳು ನಿಜವಾದ ಆಡಿಯೊ ಔಟ್ಪುಟ್ ರಚಿಸಲು. ನರಮಂಡಲವು ಸಾಮಾನ್ಯವಾಗಿ ಎರಡು ಮುಖ್ಯ ಭಾಗಗಳನ್ನು ಒಳಗೊಂಡಿದೆ: ಎನ್ಕೋಡರ್ ಮತ್ತು ಡಿಕೋಡರ್.
ಎನ್ಕೋಡರ್ ವಿವಿಧ ಇನ್ಪುಟ್ ವೆಕ್ಟರ್ಗಳ ಆಧಾರದ ಮೇಲೆ ಒಂದೇ ಸಾರಾಂಶ ವೆಕ್ಟರ್ ಅನ್ನು ನಿರ್ಮಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ. ಔಟ್ಪುಟ್ ಏನಾಗಿರಬೇಕು ಎಂಬುದರ ಪ್ರಾತಿನಿಧ್ಯವನ್ನು ರಚಿಸಲು ಫೋನೆಮ್ಗಳು, ಭಾವನಾತ್ಮಕ ಅಂಶಗಳು ಮತ್ತು ಧ್ವನಿ ವೈಶಿಷ್ಟ್ಯಗಳ ಕುರಿತು ಮಾಹಿತಿಯನ್ನು ಎನ್ಕೋಡರ್ನಲ್ಲಿ ಇರಿಸಲಾಗುತ್ತದೆ. ಡಿಕೋಡರ್ ನಂತರ ಈ ಪ್ರಾತಿನಿಧ್ಯವನ್ನು ಆಡಿಯೋ ಆಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ ಮತ್ತು ವಿಶ್ವಾಸಾರ್ಹ ಸ್ಕೋರ್ ಅನ್ನು ಔಟ್ಪುಟ್ ಮಾಡುತ್ತದೆ.
15.ai ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ ನಂತರ ಅತ್ಯುತ್ತಮ ವಿಶ್ವಾಸಾರ್ಹ ಸ್ಕೋರ್ನೊಂದಿಗೆ ಅಗ್ರ ಮೂರು ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ.
ತೊಂದರೆಗಳು
AI- ರಚಿತವಾದ ವಿಷಯದ ಏರಿಕೆಯೊಂದಿಗೆ deepfakes, ನೈಜ ಜನರನ್ನು ಅನುಕರಿಸುವ ಸುಧಾರಿತ AI ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವುದು ಗಂಭೀರ ನೈತಿಕ ಸಮಸ್ಯೆಯಾಗಿದೆ.
ಪ್ರಸ್ತುತ, 15.ai ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್ನಿಂದ ನೀವು ಆಯ್ಕೆ ಮಾಡಬಹುದಾದ ಧ್ವನಿಗಳು ಎಲ್ಲಾ ಕಾಲ್ಪನಿಕ ಪಾತ್ರಗಳಾಗಿವೆ. ಆದಾಗ್ಯೂ, ಇದು ಆನ್ಲೈನ್ನಲ್ಲಿ ಕೆಲವು ವಿವಾದಗಳನ್ನು ಗಳಿಸುವುದನ್ನು ಅಪ್ಲಿಕೇಶನ್ ತಡೆಯಲಿಲ್ಲ.
ಕೆಲವು ಧ್ವನಿ ನಟರು ಧ್ವನಿ ಕ್ಲೋನಿಂಗ್ ತಂತ್ರಜ್ಞಾನದ ಬಳಕೆಯನ್ನು ಹಿಂದಕ್ಕೆ ತಳ್ಳಿದ್ದಾರೆ. ಅವರ ಕಳವಳಗಳು ಸೋಗು ಹಾಕುವಿಕೆ, ಸ್ಪಷ್ಟವಾದ ವಿಷಯದಲ್ಲಿ ಅವರ ಧ್ವನಿಯ ಬಳಕೆ ಮತ್ತು ತಂತ್ರಜ್ಞಾನವು ಧ್ವನಿ ನಟನ ಪಾತ್ರವನ್ನು ಬಳಕೆಯಲ್ಲಿಲ್ಲದಿರುವ ಸಾಧ್ಯತೆಯನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ.
2022 ರಲ್ಲಿ ವಾಯ್ಸ್ವರ್ಸ್ ಎನ್ಎಫ್ಟಿ ಎಂಬ ಕಂಪನಿಯು ತಮ್ಮ ಮಾರ್ಕೆಟಿಂಗ್ ಪ್ರಚಾರಕ್ಕಾಗಿ ವಿಷಯವನ್ನು ರಚಿಸಲು 15.ai ಅನ್ನು ಬಳಸುತ್ತಿರುವುದನ್ನು ಪತ್ತೆಹಚ್ಚಿದಾಗ ಮತ್ತೊಂದು ವಿವಾದವು ಸಂಭವಿಸಿದೆ.
ತೀರ್ಮಾನ
ದೈನಂದಿನ ಜೀವನದಲ್ಲಿ ಪಠ್ಯದಿಂದ ಭಾಷಣವು ಈಗಾಗಲೇ ಸಾಕಷ್ಟು ಪ್ರಚಲಿತವಾಗಿದೆ. ಧ್ವನಿ ಸಹಾಯಕರು, ಜಿಪಿಎಸ್ ನ್ಯಾವಿಗೇಟರ್ಗಳು. ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ಫೋನ್ ಕರೆಗಳು ಈಗಾಗಲೇ ಸಾಮಾನ್ಯ ಸ್ಥಳವಾಗಿದೆ. ಆದಾಗ್ಯೂ, ಈ ಅಪ್ಲಿಕೇಶನ್ಗಳು ಸ್ಪಷ್ಟವಾಗಿ ಮಾನವರಲ್ಲದವುಗಳಾಗಿವೆ, ಅವುಗಳು ಯಂತ್ರ-ನಿರ್ಮಿತ ಭಾಷಣ ಎಂದು ನಾವು ಹೇಳಬಹುದು.
ನೈಸರ್ಗಿಕ-ಧ್ವನಿ ಮತ್ತು ಭಾವನಾತ್ಮಕ TTS ತಂತ್ರಜ್ಞಾನವು ಹೊಸ ಅಪ್ಲಿಕೇಶನ್ಗಳಿಗೆ ಬಾಗಿಲು ತೆರೆಯಬಹುದು. ಆದಾಗ್ಯೂ, ಧ್ವನಿ ಅಬೀಜ ಸಂತಾನೋತ್ಪತ್ತಿಯ ನೈತಿಕತೆಯು ಇನ್ನೂ ಪ್ರಶ್ನಾರ್ಹವಾಗಿದೆ. ಈ ಹೆಚ್ಚಿನ ಸಂಶೋಧಕರು ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಸಾರ್ವಜನಿಕರೊಂದಿಗೆ ಹಂಚಿಕೊಳ್ಳಲು ಏಕೆ ಹಿಂಜರಿಯುತ್ತಾರೆ ಎಂಬುದು ಖಂಡಿತವಾಗಿಯೂ ಅರ್ಥಪೂರ್ಣವಾಗಿದೆ.
ಪ್ರತ್ಯುತ್ತರ ನೀಡಿ