ಜನರೇಟಿವ್ AI ಕ್ರಾಂತಿಗೆ ಕಾರಣವೇನು?

ಪರಿವಿಡಿ[ಮರೆಮಾಡಿ][ತೋರಿಸಿ]

ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳ ಏರಿಕೆ
ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು ಎಲ್ಲವನ್ನೂ ಬದಲಾಯಿಸುತ್ತವೆ
GPT-3 ಮತ್ತು ಇಂಟರ್ನೆಟ್
ಪ್ರಸರಣ ಮಾದರಿಗಳು: ಪಠ್ಯದಿಂದ ಚಿತ್ರಗಳಿಗೆ
ಜನರೇಟಿವ್ AI ಕ್ರಾಂತಿ: ಮುಂದೆ ಏನಾಗುತ್ತದೆ?

ನಾವು ಬಹುಶಃ ಹೊಸ ಉತ್ಪಾದಕ AI ಕ್ರಾಂತಿಯ ಪ್ರಾರಂಭದಲ್ಲಿದ್ದೇವೆ.

ಜನರೇಟಿವ್ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯು ವಿಷಯವನ್ನು ರಚಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿರುವ ಕ್ರಮಾವಳಿಗಳು ಮತ್ತು ಮಾದರಿಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಅಂತಹ ಮಾದರಿಗಳ ಔಟ್‌ಪುಟ್ ಪಠ್ಯ, ಆಡಿಯೊ ಮತ್ತು ಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ, ಇದನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ನಿಜವಾದ ಮಾನವ ಔಟ್‌ಪುಟ್ ಎಂದು ತಪ್ಪಾಗಿ ಗ್ರಹಿಸಬಹುದು.

ನಂತಹ ಅಪ್ಲಿಕೇಶನ್‌ಗಳು ಚಾಟ್ GPT ಜನರೇಟಿವ್ AI ಕೇವಲ ಹೊಸತನವಲ್ಲ ಎಂದು ತೋರಿಸಿವೆ. AI ಈಗ ವಿವರವಾದ ಸೂಚನೆಗಳನ್ನು ಅನುಸರಿಸಲು ಸಮರ್ಥವಾಗಿದೆ ಮತ್ತು ಜಗತ್ತು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದರ ಬಗ್ಗೆ ಆಳವಾದ ತಿಳುವಳಿಕೆಯನ್ನು ಹೊಂದಿದೆ ಎಂದು ತೋರುತ್ತದೆ.

ಆದರೆ ನಾವು ಈ ಹಂತಕ್ಕೆ ಹೇಗೆ ಬಂದೆವು? ಈ ಮಾರ್ಗದರ್ಶಿಯಲ್ಲಿ, ಈ ಹೊಸ ಮತ್ತು ಉತ್ತೇಜಕ AI ಕ್ರಾಂತಿಗೆ ದಾರಿಮಾಡಿಕೊಟ್ಟ AI ಸಂಶೋಧನೆಯಲ್ಲಿನ ಕೆಲವು ಪ್ರಮುಖ ಪ್ರಗತಿಗಳ ಮೂಲಕ ನಾವು ಹೋಗುತ್ತೇವೆ.

ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳ ಏರಿಕೆ

ಆಧುನಿಕ AI ಯ ಮೂಲವನ್ನು ಸಂಶೋಧನೆಗೆ ನೀವು ಪತ್ತೆಹಚ್ಚಬಹುದು ಆಳವಾದ ಕಲಿಕೆ ಮತ್ತು ನರ ಜಾಲಗಳು 2012 ರಲ್ಲಿ.

ಆ ವರ್ಷದಲ್ಲಿ, ಟೊರೊಂಟೊ ವಿಶ್ವವಿದ್ಯಾನಿಲಯದ ಅಲೆಕ್ಸ್ ಕ್ರಿಜೆವ್ಸ್ಕಿ ಮತ್ತು ಅವರ ತಂಡವು ವಸ್ತುಗಳನ್ನು ವರ್ಗೀಕರಿಸುವ ಅತ್ಯಂತ ನಿಖರವಾದ ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಸಾಧಿಸಲು ಸಾಧ್ಯವಾಯಿತು.

ನಮ್ಮ ಅತ್ಯಾಧುನಿಕ ನರಮಂಡಲ, ಈಗ ಅಲೆಕ್ಸ್‌ನೆಟ್ ಎಂದು ಕರೆಯಲ್ಪಡುವ, ಇಮೇಜ್‌ನೆಟ್ ದೃಶ್ಯ ಡೇಟಾಬೇಸ್‌ನಲ್ಲಿರುವ ವಸ್ತುಗಳನ್ನು ರನ್ನರ್-ಅಪ್‌ಗಿಂತ ಕಡಿಮೆ ದೋಷ ದರದೊಂದಿಗೆ ವರ್ಗೀಕರಿಸಲು ಸಾಧ್ಯವಾಯಿತು.

ಅಲೆಕ್ಸ್ನೆಟ್ ರೇಖಾಚಿತ್ರ

ನರ ಜಾಲಗಳು ಕೆಲವು ತರಬೇತಿ ಡೇಟಾದ ಆಧಾರದ ಮೇಲೆ ನಿರ್ದಿಷ್ಟ ನಡವಳಿಕೆಯನ್ನು ಕಲಿಯಲು ಗಣಿತದ ಕಾರ್ಯಗಳ ಜಾಲವನ್ನು ಬಳಸುವ ಕ್ರಮಾವಳಿಗಳು. ಉದಾಹರಣೆಗೆ, ಕ್ಯಾನ್ಸರ್ನಂತಹ ರೋಗವನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ನೀವು ನರಮಂಡಲದ ವೈದ್ಯಕೀಯ ಡೇಟಾವನ್ನು ನೀಡಬಹುದು.

ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ನಿಧಾನವಾಗಿ ಡೇಟಾದಲ್ಲಿ ಮಾದರಿಗಳನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಕಾದಂಬರಿ ಡೇಟಾವನ್ನು ನೀಡಿದಾಗ ಹೆಚ್ಚು ನಿಖರವಾಗುತ್ತದೆ ಎಂಬುದು ಭರವಸೆ.

AlexNet ಒಂದು ಅದ್ಭುತವಾದ ಅಪ್ಲಿಕೇಶನ್ ಆಗಿತ್ತು ಕನ್ವೊಲೇಶನಲ್ ನರ ಜಾಲ ಅಥವಾ ಸಿಎನ್‌ಎನ್‌ಗಳು. "ಕನ್ವಲ್ಯೂಷನಲ್" ಕೀವರ್ಡ್ ಕನ್ವಲ್ಯೂಷನಲ್ ಲೇಯರ್‌ಗಳ ಸೇರ್ಪಡೆಯನ್ನು ಸೂಚಿಸುತ್ತದೆ, ಅದು ಹತ್ತಿರವಿರುವ ಡೇಟಾಗೆ ಹೆಚ್ಚು ಒತ್ತು ನೀಡುತ್ತದೆ.

1980 ರ ದಶಕದಲ್ಲಿ CNN ಗಳು ಈಗಾಗಲೇ ಒಂದು ಕಲ್ಪನೆಯಾಗಿದ್ದರೂ, ಇತ್ತೀಚಿನ GPU ತಂತ್ರಜ್ಞಾನವು ತಂತ್ರಜ್ಞಾನವನ್ನು ಹೊಸ ಎತ್ತರಕ್ಕೆ ತಳ್ಳಿದಾಗ 2010 ರ ದಶಕದ ಆರಂಭದಲ್ಲಿ ಜನಪ್ರಿಯತೆಯನ್ನು ಗಳಿಸಲು ಪ್ರಾರಂಭಿಸಿತು.

ಕ್ಷೇತ್ರದಲ್ಲಿ ಸಿಎನ್‌ಎನ್‌ಗಳ ಯಶಸ್ಸು ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ನರ ಜಾಲಗಳ ಸಂಶೋಧನೆಯಲ್ಲಿ ಹೆಚ್ಚಿನ ಆಸಕ್ತಿಗೆ ಕಾರಣವಾಯಿತು.

ಗೂಗಲ್ ಮತ್ತು ಫೇಸ್‌ಬುಕ್‌ನಂತಹ ಟೆಕ್ ದೈತ್ಯರು ತಮ್ಮದೇ ಆದ AI ಫ್ರೇಮ್‌ವರ್ಕ್‌ಗಳನ್ನು ಸಾರ್ವಜನಿಕರಿಗೆ ಬಿಡುಗಡೆ ಮಾಡಲು ನಿರ್ಧರಿಸಿದ್ದಾರೆ. ಉನ್ನತ ಮಟ್ಟದ API ಗಳು ಕೇರಸ್ ಆಳವಾದ ನರ ನೆಟ್‌ವರ್ಕ್‌ಗಳನ್ನು ಪ್ರಯೋಗಿಸಲು ಬಳಕೆದಾರರಿಗೆ ಒಂದು ಬಳಕೆದಾರ ಸ್ನೇಹಿ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ನೀಡಿದೆ.

ಆಳವಾದ ಕಲಿಕೆಯ ಮಾದರಿಗಳನ್ನು ಪ್ರಯೋಗಿಸಲು ಕೆರಾಸ್ ಬಳಕೆದಾರ ಸ್ನೇಹಿ ಮಾರ್ಗವನ್ನು ಒದಗಿಸಿದೆ

ಸಿಎನ್‌ಎನ್‌ಗಳು ಚಿತ್ರ ಗುರುತಿಸುವಿಕೆ ಮತ್ತು ವೀಡಿಯೊ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ ಉತ್ತಮವಾಗಿವೆ ಆದರೆ ಭಾಷಾ-ಆಧಾರಿತ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಬಂದಾಗ ತೊಂದರೆಗಳನ್ನು ಎದುರಿಸುತ್ತಿವೆ. ನೈಸರ್ಗಿಕ ಭಾಷಾ ಸಂಸ್ಕರಣೆಯಲ್ಲಿ ಈ ಮಿತಿಯು ಅಸ್ತಿತ್ವದಲ್ಲಿರಬಹುದು ಏಕೆಂದರೆ ಚಿತ್ರಗಳು ಮತ್ತು ಪಠ್ಯವು ಮೂಲಭೂತವಾಗಿ ಹೇಗೆ ವಿಭಿನ್ನ ಸಮಸ್ಯೆಗಳಾಗಿವೆ.

ಉದಾಹರಣೆಗೆ, ಚಿತ್ರವು ಟ್ರಾಫಿಕ್ ಲೈಟ್ ಅನ್ನು ಹೊಂದಿದೆಯೇ ಎಂದು ವರ್ಗೀಕರಿಸುವ ಮಾದರಿಯನ್ನು ನೀವು ಹೊಂದಿದ್ದರೆ, ಪ್ರಶ್ನೆಯಲ್ಲಿರುವ ಟ್ರಾಫಿಕ್ ಲೈಟ್ ಚಿತ್ರದಲ್ಲಿ ಎಲ್ಲಿಯಾದರೂ ಕಾಣಿಸಿಕೊಳ್ಳಬಹುದು. ಆದಾಗ್ಯೂ, ಈ ರೀತಿಯ ಮೃದುತ್ವವು ಭಾಷೆಯಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದಿಲ್ಲ. "ಬಾಬ್ ಈಟ್ ಫಿಶ್" ಮತ್ತು "ಫಿಶ್ ಈಟ್ ಬಾಬ್" ಎಂಬ ವಾಕ್ಯಗಳು ಒಂದೇ ಪದಗಳನ್ನು ಬಳಸುತ್ತಿದ್ದರೂ ವಿಭಿನ್ನ ಅರ್ಥಗಳನ್ನು ಹೊಂದಿವೆ.

ಮಾನವ ಭಾಷೆಯನ್ನು ಒಳಗೊಂಡಿರುವ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಸಂಶೋಧಕರು ಹೊಸ ವಿಧಾನವನ್ನು ಕಂಡುಕೊಳ್ಳುವ ಅಗತ್ಯವಿದೆ ಎಂಬುದು ಸ್ಪಷ್ಟವಾಯಿತು.

ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು ಎಲ್ಲವನ್ನೂ ಬದಲಾಯಿಸುತ್ತವೆ

2017 ನಲ್ಲಿ, a ಸಂಶೋಧನಾ ಲೇಖನ "ಗಮನ ನಿಮಗೆ ಬೇಕಾಗಿರುವುದು" ಎಂಬ ಶೀರ್ಷಿಕೆಯ ಹೊಸ ರೀತಿಯ ನೆಟ್‌ವರ್ಕ್ ಅನ್ನು ಪ್ರಸ್ತಾಪಿಸಲಾಗಿದೆ: ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್.

ಸಿಎನ್‌ಎನ್‌ಗಳು ಚಿತ್ರದ ಸಣ್ಣ ಭಾಗಗಳನ್ನು ಪದೇ ಪದೇ ಫಿಲ್ಟರ್ ಮಾಡುವ ಮೂಲಕ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿರುವಾಗ, ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್‌ಗಳು ಡೇಟಾದಲ್ಲಿನ ಪ್ರತಿಯೊಂದು ಅಂಶವನ್ನು ಪ್ರತಿಯೊಂದು ಅಂಶದೊಂದಿಗೆ ಸಂಪರ್ಕಿಸುತ್ತದೆ. ಸಂಶೋಧಕರು ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು "ಸ್ವಯಂ-ಗಮನ" ಎಂದು ಕರೆಯುತ್ತಾರೆ.

ಸಿಎನ್ಎನ್ ಆರ್ಕಿಟೆಕ್ಚರ್ನ ರೇಖಾಚಿತ್ರ ರೇಖಾಚಿತ್ರ

ವಾಕ್ಯಗಳನ್ನು ಪಾರ್ಸ್ ಮಾಡಲು ಪ್ರಯತ್ನಿಸುವಾಗ, ಸಿಎನ್ಎನ್ಗಳು ಮತ್ತು ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು ವಿಭಿನ್ನವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ. CNN ಒಂದಕ್ಕೊಂದು ಹತ್ತಿರವಿರುವ ಪದಗಳೊಂದಿಗೆ ಸಂಪರ್ಕಗಳನ್ನು ರೂಪಿಸುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ, ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ವಾಕ್ಯದಲ್ಲಿನ ಪ್ರತಿಯೊಂದು ಪದದ ನಡುವೆ ಸಂಪರ್ಕವನ್ನು ರಚಿಸುತ್ತದೆ.

ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಆರ್ಕಿಟೆಕ್ಚರ್ನ ಸ್ಕೆಚ್ ರೇಖಾಚಿತ್ರ

ಸ್ವಯಂ-ಗಮನ ಪ್ರಕ್ರಿಯೆಯು ಮಾನವ ಭಾಷೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಅವಿಭಾಜ್ಯ ಅಂಗವಾಗಿದೆ. ಝೂಮ್ ಔಟ್ ಮಾಡುವ ಮೂಲಕ ಮತ್ತು ಇಡೀ ವಾಕ್ಯವು ಹೇಗೆ ಒಟ್ಟಿಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ ಎಂಬುದನ್ನು ನೋಡುವ ಮೂಲಕ, ಯಂತ್ರಗಳು ವಾಕ್ಯದ ರಚನೆಯ ಬಗ್ಗೆ ಸ್ಪಷ್ಟವಾದ ತಿಳುವಳಿಕೆಯನ್ನು ಹೊಂದಬಹುದು.

ಮೊದಲ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಮಾದರಿಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದ ನಂತರ, ಇಂಟರ್ನೆಟ್ನಲ್ಲಿ ಕಂಡುಬರುವ ನಂಬಲಾಗದ ಪ್ರಮಾಣದ ಪಠ್ಯ ಡೇಟಾದ ಲಾಭವನ್ನು ಪಡೆಯಲು ಸಂಶೋಧಕರು ಶೀಘ್ರದಲ್ಲೇ ಹೊಸ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬಳಸಿದರು.

GPT-3 ಮತ್ತು ಇಂಟರ್ನೆಟ್

2020 ರಲ್ಲಿ, OpenAI ನ GPT-3 ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್‌ಗಳು ಎಷ್ಟು ಪರಿಣಾಮಕಾರಿ ಎಂದು ಮಾದರಿ ತೋರಿಸಿದೆ. GPT-3 ಮಾನವನಿಂದ ಬಹುತೇಕ ಅಸ್ಪಷ್ಟವಾಗಿ ತೋರುವ ಪಠ್ಯವನ್ನು ಔಟ್‌ಪುಟ್ ಮಾಡಲು ಸಾಧ್ಯವಾಯಿತು. GPT-3 ಅನ್ನು ಎಷ್ಟು ಶಕ್ತಿಯುತವಾಗಿಸಿದೆ ಎಂಬುದರ ಭಾಗವೆಂದರೆ ಬಳಸಿದ ತರಬೇತಿ ಡೇಟಾ. ಹೆಚ್ಚಿನ ಮಾದರಿಯ ಪೂರ್ವ-ತರಬೇತಿ ಡೇಟಾಸೆಟ್ 400 ಬಿಲಿಯನ್ ಟೋಕನ್‌ಗಳೊಂದಿಗೆ ಬರುವ ಕಾಮನ್ ಕ್ರಾಲ್ ಎಂದು ಕರೆಯಲ್ಪಡುವ ಡೇಟಾಸೆಟ್‌ನಿಂದ ಬಂದಿದೆ.

ವಾಸ್ತವಿಕ ಮಾನವ ಪಠ್ಯವನ್ನು ರಚಿಸುವ GPT-3 ನ ಸಾಮರ್ಥ್ಯವು ತನ್ನದೇ ಆದ ಮೇಲೆ ಅದ್ಭುತವಾಗಿದೆ, ಅದೇ ಮಾದರಿಯು ಇತರ ಕಾರ್ಯಗಳನ್ನು ಹೇಗೆ ಪರಿಹರಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ಸಂಶೋಧಕರು ಕಂಡುಹಿಡಿದಿದ್ದಾರೆ.

ಉದಾಹರಣೆಗೆ, ಟ್ವೀಟ್ ಅನ್ನು ರಚಿಸಲು ನೀವು ಬಳಸಬಹುದಾದ ಅದೇ GPT-3 ಮಾದರಿಯು ಪಠ್ಯವನ್ನು ಸಾರಾಂಶಗೊಳಿಸಲು, ಪ್ಯಾರಾಗ್ರಾಫ್ ಅನ್ನು ಪುನಃ ಬರೆಯಲು ಮತ್ತು ಕಥೆಯನ್ನು ಮುಗಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಭಾಷಾ ಮಾದರಿಗಳು ಅವು ಎಷ್ಟು ಶಕ್ತಿಯುತವಾಗಿವೆಯೆಂದರೆ ಅವು ಈಗ ಮೂಲಭೂತವಾಗಿ ಯಾವುದೇ ರೀತಿಯ ಆಜ್ಞೆಯನ್ನು ಅನುಸರಿಸುವ ಸಾಮಾನ್ಯ-ಉದ್ದೇಶದ ಸಾಧನಗಳಾಗಿವೆ.

gpt-3 ನಂತಹ ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿಗಳಿಂದ ಉತ್ಪಾದಕ AI ಕ್ರಾಂತಿಯನ್ನು ವೇಗಗೊಳಿಸಲಾಯಿತು

GPT-3 ನ ಸಾಮಾನ್ಯ ಉದ್ದೇಶದ ಸ್ವರೂಪವು ಅಂತಹ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ಅವಕಾಶ ನೀಡಿದೆ GitHub Copilot, ಇದು ಪ್ರೋಗ್ರಾಮರ್‌ಗಳಿಗೆ ಸರಳ ಇಂಗ್ಲಿಷ್‌ನಿಂದ ವರ್ಕಿಂಗ್ ಕೋಡ್ ಅನ್ನು ರಚಿಸಲು ಅನುಮತಿಸುತ್ತದೆ.

ಗೂಗಲ್ ಕಾಪಿಲೋಟ್‌ನ ಡೆಮೊ. ಉತ್ಪಾದಕ AI ಕ್ರಾಂತಿಯು AI ಅನ್ನು ಮಾಡಿದ ಪ್ರೋಗ್ರಾಮರ್‌ಗಳ ಮೇಲೂ ಪರಿಣಾಮ ಬೀರಬಹುದು

ಪ್ರಸರಣ ಮಾದರಿಗಳು: ಪಠ್ಯದಿಂದ ಚಿತ್ರಗಳಿಗೆ

ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್‌ಗಳು ಮತ್ತು NLP ಯೊಂದಿಗೆ ಮಾಡಿದ ಪ್ರಗತಿಯು ಇತರ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ AI ಅನ್ನು ಉತ್ಪಾದಿಸಲು ದಾರಿ ಮಾಡಿಕೊಟ್ಟಿದೆ.

ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಯ ಕ್ಷೇತ್ರದಲ್ಲಿ, ಚಿತ್ರಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಯಂತ್ರಗಳು ಹೇಗೆ ಆಳವಾದ ಕಲಿಕೆಯನ್ನು ಅನುಮತಿಸಿವೆ ಎಂಬುದನ್ನು ನಾವು ಈಗಾಗಲೇ ವಿವರಿಸಿದ್ದೇವೆ. ಆದಾಗ್ಯೂ, AI ಗೆ ಚಿತ್ರಗಳನ್ನು ವರ್ಗೀಕರಿಸುವ ಬದಲು ಅವುಗಳನ್ನು ಸ್ವತಃ ರಚಿಸುವ ಮಾರ್ಗವನ್ನು ನಾವು ಇನ್ನೂ ಕಂಡುಹಿಡಿಯಬೇಕಾಗಿದೆ.

DALL-E 2, ಸ್ಟೇಬಲ್ ಡಿಫ್ಯೂಷನ್ ಮತ್ತು ಮಿಡ್‌ಜರ್ನಿಯಂತಹ ಜನರೇಟಿವ್ ಇಮೇಜ್ ಮಾಡೆಲ್‌ಗಳು ಜನಪ್ರಿಯವಾಗಿವೆ ಏಕೆಂದರೆ ಅವುಗಳು ಪಠ್ಯ ಇನ್‌ಪುಟ್ ಅನ್ನು ಚಿತ್ರಗಳಿಗೆ ಹೇಗೆ ಪರಿವರ್ತಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.

ಡಲ್-ಇ 2 ರ ಮಾದರಿ ಔಟ್‌ಪುಟ್

ಈ ಚಿತ್ರ ಮಾದರಿಗಳು ಎರಡು ಪ್ರಮುಖ ಅಂಶಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿವೆ: ಚಿತ್ರಗಳು ಮತ್ತು ಪಠ್ಯದ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಮಾದರಿ ಮತ್ತು ಇನ್‌ಪುಟ್‌ಗೆ ಹೊಂದಿಕೆಯಾಗುವ ಹೈ-ಡೆಫಿನಿಷನ್ ಚಿತ್ರವನ್ನು ವಾಸ್ತವವಾಗಿ ರಚಿಸಬಹುದಾದ ಮಾದರಿ.

ಓಪನ್ ಎಐ ಕ್ಲಿಪ್ (ಕಾಂಟ್ರಾಸ್ಟಿವ್ ಲಾಂಗ್ವೇಜ್-ಇಮೇಜ್ ಪ್ರಿ-ಟ್ರೇನಿಂಗ್) ಒಂದು ಓಪನ್ ಸೋರ್ಸ್ ಮಾದರಿಯಾಗಿದ್ದು ಅದು ಮೊದಲ ಅಂಶವನ್ನು ಪರಿಹರಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ. ಚಿತ್ರವನ್ನು ನೀಡಿದರೆ, CLIP ಮಾದರಿಯು ನಿರ್ದಿಷ್ಟ ಚಿತ್ರಕ್ಕಾಗಿ ಹೆಚ್ಚು ಸೂಕ್ತವಾದ ಪಠ್ಯ ವಿವರಣೆಯನ್ನು ಊಹಿಸಬಹುದು.

CLIP ಮಾದರಿಯು ಪ್ರಮುಖ ಚಿತ್ರ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಹೊರತೆಗೆಯುವುದು ಮತ್ತು ಚಿತ್ರದ ಸರಳವಾದ ಪ್ರಾತಿನಿಧ್ಯವನ್ನು ಹೇಗೆ ರಚಿಸುವುದು ಎಂಬುದನ್ನು ಕಲಿಯುವ ಮೂಲಕ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.

CLIP ಚಿತ್ರಗಳು ಮತ್ತು ಪಠ್ಯದ ನಡುವಿನ ಸೇತುವೆಯಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಮತ್ತು ಉತ್ಪಾದಕ AI ಕ್ರಾಂತಿಯನ್ನು ದೃಶ್ಯ ಗೋಳಕ್ಕೆ ಸರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ

ಬಳಕೆದಾರರು DALL-E 2 ಗೆ ಮಾದರಿ ಪಠ್ಯ ಇನ್‌ಪುಟ್ ಅನ್ನು ಒದಗಿಸಿದಾಗ, CLIP ಮಾದರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಇನ್‌ಪುಟ್ ಅನ್ನು "ಇಮೇಜ್ ಎಂಬೆಡಿಂಗ್" ಆಗಿ ಪರಿವರ್ತಿಸಲಾಗುತ್ತದೆ. ರಚಿಸಿದ ಇಮೇಜ್ ಎಂಬೆಡಿಂಗ್‌ಗೆ ಹೊಂದಿಕೆಯಾಗುವ ಚಿತ್ರವನ್ನು ರಚಿಸುವ ಮಾರ್ಗವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಈಗ ಗುರಿಯಾಗಿದೆ.

ಇತ್ತೀಚಿನ ಉತ್ಪಾದಕ ಚಿತ್ರ AI ಗಳು a ಅನ್ನು ಬಳಸುತ್ತವೆ ಪ್ರಸರಣ ಮಾದರಿ ವಾಸ್ತವವಾಗಿ ಚಿತ್ರವನ್ನು ರಚಿಸುವ ಕಾರ್ಯವನ್ನು ನಿಭಾಯಿಸಲು. ಡಿಫ್ಯೂಷನ್ ಮಾದರಿಗಳು ಚಿತ್ರಗಳಿಂದ ಹೆಚ್ಚುವರಿ ಶಬ್ದವನ್ನು ತೆಗೆದುಹಾಕುವುದು ಹೇಗೆ ಎಂದು ತಿಳಿಯಲು ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ನರಮಂಡಲದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ.

ತರಬೇತಿಯ ಈ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ, ನರಮಂಡಲವು ಅಂತಿಮವಾಗಿ ಯಾದೃಚ್ಛಿಕ ಶಬ್ದ ಚಿತ್ರದಿಂದ ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಶನ್ ಚಿತ್ರವನ್ನು ಹೇಗೆ ರಚಿಸುವುದು ಎಂಬುದನ್ನು ಕಲಿಯಬಹುದು. CLIP ಒದಗಿಸಿದ ಪಠ್ಯ ಮತ್ತು ಚಿತ್ರಗಳ ಮ್ಯಾಪಿಂಗ್ ಅನ್ನು ನಾವು ಈಗಾಗಲೇ ಹೊಂದಿರುವುದರಿಂದ, ನಾವು ಮಾಡಬಹುದು ಪ್ರಸರಣ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಿ ಯಾವುದೇ ಚಿತ್ರವನ್ನು ರಚಿಸಲು ಪ್ರಕ್ರಿಯೆಯನ್ನು ರಚಿಸಲು CLIP ಇಮೇಜ್ ಎಂಬೆಡಿಂಗ್‌ಗಳಲ್ಲಿ.

ಜನರೇಟಿವ್ AI ಕ್ರಾಂತಿ: ಮುಂದೆ ಏನಾಗುತ್ತದೆ?

ನಾವು ಈಗ ಪ್ರತಿ ಎರಡು ದಿನಗಳಿಗೊಮ್ಮೆ ಜನರೇಟಿವ್ AI ನಲ್ಲಿ ಪ್ರಗತಿಗಳು ಸಂಭವಿಸುವ ಹಂತದಲ್ಲಿರುತ್ತೇವೆ. AI ಅನ್ನು ಬಳಸಿಕೊಂಡು ವಿವಿಧ ರೀತಿಯ ಮಾಧ್ಯಮಗಳನ್ನು ಉತ್ಪಾದಿಸುವುದು ಸುಲಭ ಮತ್ತು ಸುಲಭವಾಗುತ್ತಿರುವಾಗ, ಇದು ನಮ್ಮ ಸಮಾಜದ ಮೇಲೆ ಹೇಗೆ ಪರಿಣಾಮ ಬೀರುತ್ತದೆ ಎಂಬುದರ ಕುರಿತು ನಾವು ಚಿಂತಿಸಬೇಕೇ?

ಉಗಿ ಯಂತ್ರದ ಆವಿಷ್ಕಾರದ ನಂತರ ಕಾರ್ಮಿಕರನ್ನು ಬದಲಿಸುವ ಯಂತ್ರಗಳ ಚಿಂತೆ ಯಾವಾಗಲೂ ಸಂಭಾಷಣೆಯಲ್ಲಿದ್ದರೂ, ಈ ಬಾರಿ ಅದು ಸ್ವಲ್ಪ ವಿಭಿನ್ನವಾಗಿದೆ ಎಂದು ತೋರುತ್ತದೆ.

ಜನರೇಟಿವ್ AI ಬಹುಪಯೋಗಿ ಸಾಧನವಾಗಿ ಮಾರ್ಪಡುತ್ತಿದೆ, ಇದು AI ಸ್ವಾಧೀನದಿಂದ ಸುರಕ್ಷಿತವೆಂದು ಪರಿಗಣಿಸಲಾದ ಕೈಗಾರಿಕೆಗಳನ್ನು ಅಡ್ಡಿಪಡಿಸಬಹುದು.

AI ಕೆಲವು ಮೂಲಭೂತ ಸೂಚನೆಗಳಿಂದ ದೋಷರಹಿತ ಕೋಡ್ ಬರೆಯಲು ಪ್ರಾರಂಭಿಸಿದರೆ ನಮಗೆ ಪ್ರೋಗ್ರಾಮರ್‌ಗಳು ಅಗತ್ಯವಿದೆಯೇ? ಜನರು ತಾವು ಬಯಸಿದ ಔಟ್‌ಪುಟ್ ಅನ್ನು ಅಗ್ಗವಾಗಿ ಉತ್ಪಾದಿಸಲು ಉತ್ಪಾದಕ ಮಾದರಿಯನ್ನು ಬಳಸಬಹುದಾದರೆ ಸೃಜನಶೀಲರನ್ನು ನೇಮಿಸಿಕೊಳ್ಳುತ್ತಾರೆಯೇ?

ಉತ್ಪಾದಕ AI ಕ್ರಾಂತಿಯ ಭವಿಷ್ಯವನ್ನು ಊಹಿಸುವುದು ಕಷ್ಟ. ಆದರೆ ಈಗ ಸಾಂಕೇತಿಕ ಪಂಡೋರಾ ಪೆಟ್ಟಿಗೆಯನ್ನು ತೆರೆಯಲಾಗಿದೆ, ತಂತ್ರಜ್ಞಾನವು ಪ್ರಪಂಚದ ಮೇಲೆ ಸಕಾರಾತ್ಮಕ ಪರಿಣಾಮವನ್ನು ಬೀರುವ ಹೆಚ್ಚು ಉತ್ತೇಜಕ ಆವಿಷ್ಕಾರಗಳಿಗೆ ಅವಕಾಶ ನೀಡುತ್ತದೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ.

ಜನರೇಟಿವ್ AI ಕ್ರಾಂತಿಗೆ ಕಾರಣವೇನು?

ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳ ಏರಿಕೆ

ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು ಎಲ್ಲವನ್ನೂ ಬದಲಾಯಿಸುತ್ತವೆ

GPT-3 ಮತ್ತು ಇಂಟರ್ನೆಟ್

ಪ್ರಸರಣ ಮಾದರಿಗಳು: ಪಠ್ಯದಿಂದ ಚಿತ್ರಗಳಿಗೆ

ಜನರೇಟಿವ್ AI ಕ್ರಾಂತಿ: ಮುಂದೆ ಏನಾಗುತ್ತದೆ?

ನಮ್ಮ ಬಗ್ಗೆ ಡಿಯಾನ್ ಮೆನರ್

HashDork ನಲ್ಲಿ ಹೆಚ್ಚಿನ ಲೇಖನಗಳು:

ನಿಮ್ಮ AI ನಲ್ಲಿ ಭ್ರಮೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುವುದು ಹೇಗೆ

ಕೊಲೊಸ್ಸಿಯನ್ vs ಹೇಗೆನ್

ಈ ಭವಿಷ್ಯದ ಟೆಕ್ ಸುದ್ದಿಪತ್ರವು ಹೀರುವುದಿಲ್ಲ

ಜನರೇಟಿವ್ AI ಕ್ರಾಂತಿಗೆ ಕಾರಣವೇನು?

ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳ ಏರಿಕೆ

ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು ಎಲ್ಲವನ್ನೂ ಬದಲಾಯಿಸುತ್ತವೆ

GPT-3 ಮತ್ತು ಇಂಟರ್ನೆಟ್

ಪ್ರಸರಣ ಮಾದರಿಗಳು: ಪಠ್ಯದಿಂದ ಚಿತ್ರಗಳಿಗೆ

ಜನರೇಟಿವ್ AI ಕ್ರಾಂತಿ: ಮುಂದೆ ಏನಾಗುತ್ತದೆ?

ನಮ್ಮ ಬಗ್ಗೆ ಡಿಯಾನ್ ಮೆನರ್

HashDork ನಲ್ಲಿ ಹೆಚ್ಚಿನ ಲೇಖನಗಳು:

ನಿಮ್ಮ AI ನಲ್ಲಿ ಭ್ರಮೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುವುದು ಹೇಗೆ

ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮಕ್ಕಾಗಿ 10 ಅತ್ಯುತ್ತಮ AI ಪರಿಕರಗಳು

ಕೊಲೊಸ್ಸಿಯನ್ vs ಹೇಗೆನ್

10 ಅತ್ಯುತ್ತಮ AI ಅನಿಮೇಟೆಡ್ ವೀಡಿಯೊ ಮೇಕರ್ ಪರಿಕರಗಳು

ರೀಡರ್ ಹೊಂದಾಣಿಕೆ

ಪ್ರತ್ಯುತ್ತರ ನೀಡಿ ಉತ್ತರ ರದ್ದು

ಈ ಭವಿಷ್ಯದ ಟೆಕ್ ಸುದ್ದಿಪತ್ರವು ಹೀರುವುದಿಲ್ಲ