ما هو FinOps ولماذا تغيّر دوره في 2026؟
FinOps ممارسة إدارية وثقافية تجمع فرق المالية والهندسة والأعمال حول هدف واحد: تحقيق أقصى قيمة من كل ريال يُنفَق على السحابة. لم يَعُد الأمر مجرد خفض الفاتورة، بل قياس القيمة التقنية وربطها بالعائد.
ما تغيّر في 2026 هو موقع FinOps داخل المؤسسة. فوفق تقرير State of FinOps 2026 أصبح 78% من فرق FinOps يرفعون تقاريرهم إلى الـCTO أو الـCIO، وتحوّل الانضباط من ردّ فعل متأخّر (تحليل فاتورة بعد انتهاء الشهر) إلى ممارسة استباقية تُشكّل قرارات التقنية قبل الالتزام بها، وهو ما يُعرف بـ«Shift Left & Up». كما توسّع نطاقه ليشمل ليس السحابة فقط بل إنفاق الـSaaS والتراخيص والسحابة الخاصة ومراكز البيانات.
لماذا أصبح الذكاء الاصطناعي المحرّك الأول لتضخّم الفواتير؟
القفزة الأبرز في تقرير 2026: 98% من المؤسسات باتت تدير إنفاق الذكاء الاصطناعي، صعوداً من 63% في 2025 و31% في 2024 — وهو أسرع منحنى تبنٍّ تسجّله مؤسسة FinOps على الإطلاق.
السبب أن إنفاق الـAI يكسر «كتيّب» تحسين التكاليف التقليدي؛ فمصدر النزيف لم يَعُد آلة افتراضية منسيّة أو لقطة تخزين قديمة، بل:
- نماذج لغوية كبيرة باستدلال (inference) يعمل على مدار الساعة.
- مهام تدريب متقطّعة (bursty) تستهلك وحدات GPU باهظة على دفعات.
- معماريات هجينة معقّدة يصعب تتبّع تكلفتها.
النتيجة إنفاق متقلّب ومرتبط بالاستخدام يحتاج رقابة لحظية لا مراجعة شهرية، ولهذا صارت «إدارة تكاليف الـAI» المهارة الأكثر طلباً عبر المؤسسات بمختلف أحجامها.
أربع ممارسات عملية لإيقاف النزيف
أولاً — فرض الوسوم (Tagging) عند الإنشاء. لا تترك الوسوم لتُضاف لاحقاً في جدول بيانات، بل افرضها على مستوى البنية عبر AWS Service Control Policies أو Azure Policy أو GCP Organization Policies، مع وسوم إلزامية مثل cost_center وapplication وenvironment وowner_email وlifecycle_status.
ثانياً — ابدأ بـShowback ثم انتقل إلى Chargeback. أرسِل لكل فريق تقرير إنفاق أسبوعياً (عبر البريد أو Slack) لمدة 4–6 أسابيع لبناء الثقة وكشف فجوات الوسوم، ثم انتقل إلى تحميل التكلفة الفعلي (chargeback) بعد تجاوز نسبة تغطية الوسوم 80%.
ثالثاً — حسّن وحدات GPU بذكاء. احجز السعة عند «أرضية الاستخدام» (الكمية التي تشغّلها 95% من الوقت) عبر Reserved Instances وSavings Plans، واستخدم Spot أو On-Demand للذروة فوق ذلك، واعتمد المعالجة على دفعات (batch inference) للأحمال غير اللحظية لخفض تكلفة الطلب الواحد.
رابعاً — قِس التكلفة لكل وحدة أعمال. عرّف مؤشرات مثل التكلفة لكل مستخدم نشط أو لكل استدعاء API أو لكل عملية استدلال أو لكل غيغابايت معالَج، وتابعها أسبوعياً؛ فهذه المؤشرات — لا الفاتورة الإجمالية — هي ما يكشف الهدر مبكراً، خصوصاً مع أدوات الـAI التي ترصد الشذوذ في الإنفاق لحظياً.
لماذا يهمّ هذا السوق السعودي والخليجي؟
مع تسارع التحول الرقمي ضمن رؤية 2030 وتوسّع تبنّي مشاريع الذكاء الاصطناعي في الجهات الحكومية والقطاع الخاص، تتحوّل تكلفة الـAI من بند تقني إلى بند استراتيجي في الميزانية. وتبنّي FinOps مبكراً يمنح المؤسسات السعودية حوكمة واضحة للإنفاق، وقدرة على توسيع مشاريع الـAI دون مفاجآت في الفاتورة، ومواءمة أفضل بين الإنفاق التقني والقيمة المتحقّقة.
خلاصة وخطوات أولى
النزيف في 2026 مصدره الذكاء الاصطناعي، وعلاجه انضباط استباقي لا ردّ فعل. ابدأ بثلاث خطوات: (1) افرض سياسة وسوم على مستوى البنية اليوم، (2) شغّل تقارير showback أسبوعية لفرقك لمدة شهر، (3) اختر مؤشّر «تكلفة لكل وحدة» واحداً وابدأ بتتبّعه. وما تبقّى يُبنى على هذه الأسس.



