
ಬರ್ನ್ : ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ (AI) ಪ್ರಾಬಲ್ಯಕ್ಕಾಗಿ ನಡೆಯುತ್ತಿರುವ ಜಾಗತಿಕ ಸ್ಪರ್ಧೆಯಲ್ಲಿ ಅಮೆರಿಕ ಮತ್ತು ಚೀನಾಗಳ ನಡುವಿನ ಪೈಪೋಟಿ ಮುಂಚೂಣಿಯಲ್ಲಿದ್ದರೂ, ಇದೀಗ ಸ್ವಿಟ್ಜರ್ಲೆಂಡ್ ಕೂಡ ಪ್ರಬಲ ಸ್ಪರ್ಧಿಯಾಗಿ ಹೊರಹೊಮ್ಮುತ್ತಿದೆ. ಭಾರತದಂತಹ ದೇಶಗಳು ಸ್ವದೇಶಿ ಸ್ಟಾರ್ಟ್ಅಪ್ಗಳನ್ನು ಉತ್ತೇಜಿಸುತ್ತಿರುವಾಗ, ಸ್ವಿಟ್ಜರ್ಲೆಂಡ್ ಸಂಪೂರ್ಣವಾಗಿ ವಿಭಿನ್ನವಾದ, ಮುಕ್ತ-ಮೂಲ ವಿಧಾನವನ್ನು ಅಳವಡಿಸಿಕೊಂಡಿದೆ.
ಆಲ್ಪೈನ್ ರಾಷ್ಟ್ರವು ಸಾರ್ವಜನಿಕ ಮೂಲಸೌಕರ್ಯವನ್ನು ಬಳಸಿಕೊಂಡು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾದ ಸಂಪೂರ್ಣ ಮುಕ್ತ-ಮೂಲ (Open-Source), ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿ (LLM) ಒಂದನ್ನು ಪರಿಚಯಿಸಲು ಸಿದ್ಧತೆ ನಡೆಸಿದೆ. ಇದನ್ನು EPFL ಮತ್ತು ETH ಜ್ಯೂರಿಚ್ನಂತಹ ಸ್ವಿಸ್ ವಿಶ್ವವಿದ್ಯಾಲಯಗಳ ಸಂಶೋಧಕರು, ದೇಶದ ರಾಷ್ಟ್ರೀಯ ಸೂಪರ್ಕಂಪ್ಯೂಟಿಂಗ್ ಸೆಂಟರ್ (CSCS) ನಲ್ಲಿನ ಎಂಜಿನಿಯರ್ಗಳ ಸಹಯೋಗದೊಂದಿಗೆ ನಿರ್ಮಿಸಿದ್ದಾರೆ.
“ಬೇಸಿಗೆಯ ಕೊನೆಯಲ್ಲಿ” ಬಿಡುಗಡೆಗೆ ಸಿದ್ಧತೆ
ಈ LLM ಪ್ರಸ್ತುತ ಅಂತಿಮ ಪರೀಕ್ಷೆಗೆ ಒಳಗಾಗುತ್ತಿದ್ದು, ಈ ವರ್ಷದ “ಬೇಸಿಗೆಯ ಕೊನೆಯಲ್ಲಿ” ಬಿಡುಗಡೆ ಮಾಡಲು ನಿರ್ಧರಿಸಲಾಗಿದೆ. ಈ ಮಾದರಿಯು 8 ಬಿಲಿಯನ್ ಮತ್ತು 70 ಬಿಲಿಯನ್ ನಿಯತಾಂಕಗಳ (parameters) ಎರಡು ಗಾತ್ರಗಳಲ್ಲಿ ಲಭ್ಯವಿರುತ್ತದೆ. ಮಾದರಿಯ ನಿಯತಾಂಕಗಳ ಸಂಖ್ಯೆಯು ಸಂಕೀರ್ಣ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಕಲಿಯುವ ಮತ್ತು ಉತ್ಪಾದಿಸುವ ಅದರ ಸಾಮರ್ಥ್ಯವನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತದೆ.
ಸ್ವಿಸ್ ಸಂಶೋಧಕರು ಈ ಮಾದರಿಯ ಮೂಲ ಕೋಡ್ ಮತ್ತು ತೂಕಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಎಲ್ಲವನ್ನೂ ಅಪಾಚೆ 2.0 ಮುಕ್ತ ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ಡೌನ್ಲೋಡ್ ಮಾಡಲು ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡಲಿದ್ದಾರೆ. ಮಾದರಿಯ ವಾಸ್ತುಶಿಲ್ಪ, ತರಬೇತಿ ವಿಧಾನಗಳು ಮತ್ತು ಬಳಕೆಯ ಮಾರ್ಗಸೂಚಿಗಳಂತಹ ವಿವರಗಳನ್ನು ಸಹ ಮಾದರಿಯ ಜೊತೆಗೆ ಬಿಡುಗಡೆ ಮಾಡಲು ಅವರು ಬದ್ಧರಾಗಿದ್ದಾರೆ.
ಮುಕ್ತ ಮಾದರಿಗಳ ಪ್ರಾಮುಖ್ಯತೆ ಮತ್ತು ಅಭಿವೃದ್ಧಿ
2022ರಲ್ಲಿ OpenAI ನ ChatGPT ಬಿಡುಗಡೆಯಾದ ನಂತರ Google, Meta, Microsoft ನಂತಹ ತಂತ್ರಜ್ಞಾನ ದೈತ್ಯರ ನಡುವೆ AI ಸ್ಪರ್ಧೆ ಶುರುವಾಯಿತು. ಅಂದಿನಿಂದ ಇದು ಜಾಗತಿಕ ಪ್ರಾಬಲ್ಯದ ಸ್ಪರ್ಧೆಯಾಗಿ ಬೆಳೆದಿದೆ, ವಿಶೇಷವಾಗಿ ಚೀನಾದ AI ಸ್ಟಾರ್ಟ್ಅಪ್ DeepSeek, ಅಲ್ಲಿಯವರೆಗೆ ಮಾರುಕಟ್ಟೆಯಲ್ಲಿ ಪ್ರಾಬಲ್ಯ ಸಾಧಿಸಿದ್ದ ಅಮೆರಿಕ ಮೂಲದ ಸಂಸ್ಥೆಗಳು ಬಳಸಿದ ಮುಚ್ಚಿದ ವ್ಯವಸ್ಥೆಗಳಿಗಿಂತ ಕಡಿಮೆ ವೆಚ್ಚದಲ್ಲಿ ಅತ್ಯಾಧುನಿಕ, ಮುಕ್ತ AI ಮಾದರಿಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವ ಮೂಲಕ ತಂತ್ರಜ್ಞಾನ ಜಗತ್ತನ್ನು ಬೆರಗುಗೊಳಿಸಿತು.
“ಸಂಪೂರ್ಣವಾಗಿ ಮುಕ್ತ ಮಾದರಿಗಳು ಹೆಚ್ಚಿನ ವಿಶ್ವಾಸಾರ್ಹ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತವೆ ಮತ್ತು AI ನ ಅಪಾಯಗಳು ಹಾಗೂ ಅವಕಾಶಗಳ ಕುರಿತು ಸಂಶೋಧನೆಯನ್ನು ಮುಂದುವರಿಸಲು ಅವಶ್ಯಕವಾಗಿವೆ. ಪಾರದರ್ಶಕ ಪ್ರಕ್ರಿಯೆಗಳು ನಿಯಂತ್ರಕ ಅನುಸರಣೆಯನ್ನು ಸಹ ಸಕ್ರಿಯಗೊಳಿಸುತ್ತವೆ” ಎಂದು EPFL AI ಕೇಂದ್ರದ ಅಧ್ಯಾಪಕ ಸದಸ್ಯರಾದ ಆಂಟೊಯಿನ್ ಬೊಸೆಲಟ್ ಮತ್ತು ಮಾರ್ಟಿನ್ ಜಗ್ಗಿ ಅವರೊಂದಿಗೆ ಈ ಪ್ರಯತ್ನವನ್ನು ಮುನ್ನಡೆಸುತ್ತಿರುವ ETH AI ಕೇಂದ್ರದ ಸಂಶೋಧನಾ ವಿಜ್ಞಾನಿ ಇಮಾನೋಲ್ ಸ್ಕ್ಲಾಗ್ ಹೇಳಿದ್ದಾರೆ.
“ನಾವು ಆರಂಭದಿಂದಲೂ ಮಾದರಿಗಳನ್ನು ಬೃಹತ್ ಬಹುಭಾಷಾ ಮಾಡಲು ಒತ್ತು ನೀಡಿದ್ದೇವೆ. ಸಾರ್ವಜನಿಕ ಸಂಸ್ಥೆಗಳ ವಿಜ್ಞಾನಿಗಳಾಗಿ, ನಾವು ಮುಕ್ತ ಮಾದರಿಗಳನ್ನು ಮುನ್ನಡೆಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದ್ದೇವೆ ಮತ್ತು ಸಂಸ್ಥೆಗಳು ತಮ್ಮದೇ ಆದ ಅನ್ವಯಿಕೆಗಳಿಗಾಗಿ ಅವುಗಳ ಮೇಲೆ ನಿರ್ಮಿಸಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತೇವೆ” ಎಂದು ಬೊಸೆಲಟ್ ಹೇಳಿದರು. “ಸಂಪೂರ್ಣ ಮುಕ್ತತೆಯನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳುವ ಮೂಲಕ, ಇದು ಸ್ವಿಟ್ಜರ್ಲೆಂಡ್ನಲ್ಲಿ, ಯುರೋಪ್ನಾದ್ಯಂತ ಮತ್ತು ಬಹುರಾಷ್ಟ್ರೀಯ ಸಹಯೋಗಗಳ ಮೂಲಕ ನಾವೀನ್ಯತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ ಎಂದು ನಾವು ಭಾವಿಸುತ್ತೇವೆ. ಇದಲ್ಲದೆ, ಇದು ಉನ್ನತ ಪ್ರತಿಭೆಗಳನ್ನು ಆಕರ್ಷಿಸುವಲ್ಲಿ ಮತ್ತು ಪೋಷಿಸುವಲ್ಲಿ ಪ್ರಮುಖ ಅಂಶವಾಗಿದೆ” ಎಂದು ಜಗ್ಗಿ ಸೇರಿಸಿದರು.
ಮಾದರಿಯ ಅಭಿವೃದ್ಧಿ ವಿಧಾನ
ಸ್ವಿಸ್ ಸಂಶೋಧಕರು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ ಮೂಲ ಮಾದರಿಯನ್ನು 1,500 ಕ್ಕೂ ಹೆಚ್ಚು ಭಾಷೆಗಳಲ್ಲಿನ ದೊಡ್ಡ ಪಠ್ಯ ಡೇಟಾಸೆಟ್ಗಳ ಮೇಲೆ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ. ಸುಮಾರು ಶೇಕಡಾ 60ರಷ್ಟು ಡೇಟಾ ಇಂಗ್ಲಿಷ್ನಲ್ಲಿತ್ತು ಮತ್ತು ಉಳಿದವು ಇಂಗ್ಲಿಷ್ ಅಲ್ಲದ ಭಾಷೆಗಳಲ್ಲಿವೆ. ಡೇಟಾಸೆಟ್ಗಳು ಕೋಡ್ ಮತ್ತು ಇತರ ಗಣಿತ-ಸಂಬಂಧಿತ ಡೇಟಾವನ್ನು ಸಹ ಒಳಗೊಂಡಿವೆ.
LLM ಅಭಿವೃದ್ಧಿಯ ಪೂರ್ವ-ತರಬೇತಿ ಹಂತದಲ್ಲಿ ವೆಬ್ ಕ್ರಾಲಿಂಗ್ ಆಯ್ಕೆಗಳನ್ನು ಗೌರವಿಸುವುದರಿಂದ ದೈನಂದಿನ ಕಾರ್ಯಗಳು ಮತ್ತು ಸಾಮಾನ್ಯ ಜ್ಞಾನ-ಸಂಬಂಧಿತ ಕಾರ್ಯಗಳಿಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ಮಾದರಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯ ಮೇಲೆ ಪರಿಣಾಮ ಬೀರುವುದಿಲ್ಲ ಎಂದು ಯೋಜನಾ ಮುಖ್ಯಸ್ಥರು ಇತ್ತೀಚೆಗೆ ಒಂದು ಅಧ್ಯಯನವನ್ನು ಪ್ರಕಟಿಸಿದರು.
ಇದರ ಜೊತೆಗೆ, 10,000 ಕ್ಕೂ ಹೆಚ್ಚು NVIDIA ಗ್ರೇಸ್ ಹಾಪರ್ GPU ಗಳ ಕ್ಲಸ್ಟರ್ಗಳನ್ನು ಒಳಗೊಂಡಿರುವ CSCS ನ ‘ಆಲ್ಪ್ಸ್’ ಸೂಪರ್ಕಂಪ್ಯೂಟರ್ ಬಳಸಿ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ನೀಡಲಾಯಿತು. “ವ್ಯವಸ್ಥೆಯ ಪ್ರಮಾಣ ಮತ್ತು ವಾಸ್ತುಶಿಲ್ಪವು 100% ಕಾರ್ಬನ್-ತಟಸ್ಥ ವಿದ್ಯುತ್ ಬಳಸಿ ಮಾದರಿಯನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ತರಬೇತಿ ಮಾಡಲು ಸಾಧ್ಯವಾಗಿಸಿತು” ಎಂದು ಪ್ರಕಟಣೆಯ ಪೋಸ್ಟ್ ತಿಳಿಸಿದೆ.