ניהול מערכות מידע = ניהול משברים (זוית ראיה)

עודכן ב: ספט 4


מנמ"ר מקצועי לא צריך לחשוש ממשברים. להיפך הוא צריך לחכות להם כמשחר לטרף וכשהם קורים –המנמ"ר הוא המבוגר האחראי. הוא פותר הבעיות.

המנמ"ר הוא בעל הכלים, הידע והמתודולוגיה להוציא את הארגון מהמשבר.

בכדי להצליח בניהול המשבר, יש להיערך היטב ומראש ובכך בעצם משברים רבים ימנעו, אבל בקרות התסריט "השחור" - מנמ"ר מקצוען ירגיש באזור הנוחות.

למען הכלליות

תגלו שהכתוב בפוסט זה אינו רלוונטי רק למשברים במערכות מידע, רוב התוכן יהיה נכון גם למשברים בעולם אבטחת המידע, למשברים בעולמות העסקיים וכמעט בכל מקום שאנו נותנים שירות.

מדוע? מאחר והגדרת משבר תיגזר מפער ציפיות אצל משתמש.

אם עד המשבר הלקוח/משתמש קיבל שירות ברמה מסוימת, בזמן מסוים באופן מסוים ו...משהו השתנה (אפילו לא בהכרח לרעה), מספיק שיש שינוי אל מול ציפיות המשתמש – נוצר משבר.

מכאן שאמירת יסוד תהיה: כגובה הציפיות – כעומק המשבר !

קרי: אם נתאם ציפיות כנדרש, מלכתחילה נפחית את עוצמת המשבר.

איפה עובר קו השבר?

נחזור ונתמקד במערכות מידע.

משברים בעיקר קורים במקום שבו נותנים שירות (משברים שקורים בזמן הקמת שירות חדש קיימים, אבל מול צורך קיים ומוגדר לשירות ועליהם לא נכתוב בפוסט זה) כלומר בעיקר בעולמות התחזוקה, השיפור וההגנה של מערכות קיימות (!).

אם יש לנו לקוחות, משתמשים, שותפים עסקיים אשר המערכות שלנו משרתות, הפסקת שירות או שיבוש שירות עובד, פוגע בהם ו... נוצר משבר.

אל תחפשו משברים גדולים במערכות שעדיין אין להן משתמשים או שהציפיות מהן נמוכות - אין כאלה.

סיפור

תרגלו פקח טיסה: "כשמטוס מודיע שהוא נוחת נחיתת אונס, מה הדבר הראשון שאתה עושה?"

אומר הפקח: "אני מייד מזעיק את מכבי האש, מגן דוד אדום, הצבא, המשטרה והחכמולוגים".

התעניינו המתרגלים: "אנחנו מבינים שאתה קורא לכוחות ההצלה והביטחון אבל החכמולוגים למה?"

עונה הפקח: " תביאו לי עכשיו את החכמולוגים מועדת החקירה. שיגידו לי עכשיו מה לעשות, לא אחרי ההתרסקות!"


אז באנו להתחכם...


סדר פעולות בעת משבר

בעת משבר, וזה נכון לסוגים שונים של משברים, חשוב שיהיה סדר פעולות אוטומטי, ידוע מראש, המתורגל לעיתים תכופות, אשר יקטין את נזקי המשבר ואפילו יוציא את הארגון מחוזק מהארוע:

  1. לימוד הסימפטומים והבנת הבעיה.

  2. תיקוף הבעיה(שנה) ווידוא שאינה מורכבת מקומבינציית תקלות (במידה וכן בידוד תקלות השורש). הבנה מדוייקת של גבולות התקלה.

  3. לימוד השפעות התקלה (משמעויות תפעוליות ומשמעויות עסקיות כפונקציה של זמן וכמות המושפעים).

  4. תקשור ברור של התקלה והשלכותיה תוך חסימת רחש בחש מזיק.

  5. הבנת המשימות לביצוע. יש להפריד בין משימות לעצירת/הגבלת הנזק לבין משימות התיקון והחזל"ש.

  6. השמת המשאבים (פנימיים וחיצוניים) הטובים והמתאימים ביותר לכל משימה ווידוא שהמשאבים פועלים מתוך הבנה ברורה של משימתם, עם יעד זמן מוקצב.

  7. סבב חיתוך מצב וקבלת החלטות.

  8. חזרה על השלבים עד כה (באופן מעגלי) עד לעצירה מוחלטת של הנזק ומעבר לשלב הפתרון.

  9. השמת המשאבים (פנימיים וחיצוניים) הטובים והמתאימים ביותר לכל משימה עד לחזל"ש.

  10. תהליך הפתרון, בדיקתו והעברתו לייצור– סינדרום ה"פיל בחנות חרסינה": להבין שבמשבר יש לחץ רב על כל המשתתפים ולכן הסיכוי שיטעו בשלבי הפתרון הוא גבוה. את ההבנה הזו יש לתרגם לצמצום הפעולות למינימום, חידוד המסרים, לא לוותר על בדיקות ולספק מטריה ניהולית המרווחת את לוחות הזמנים בכדי להקטין נזקים אפשריים.

  11. הפקת לקחים והטמעתם. על זה נאמר: "לטעות זו תכונה של הסקרנים ופורצי הדרך. לעשות את אותה טעות פעמיים...זו תכונה של האנשים שאתה לא רוצה לידך בעת מבחן".


התנהלות המנמ"ר טרם המשבר

סקר סיכונים: על המנמ"ר לוודא שמבוצעת סקירת מערכות, תקופתית, יחד עם סקירת שימושים שתוצאתה – "טבלת סיכונים" הכוללת שירותים שהפסקתם או שיבושם משמעותה - משבר (הגדרה ארגונית סובייקטיבית). לכל סיכון כדאי שיהיה "מחיר" ארגוני ידוע מראש מאחר ואותו מחיר יהווה פרמטר קובע בעת קבלת ההחלטות בעת המשבר.

תיאום (והנמכת)ציפיות: מול כל שירות משמעותי, כנגד כל סיכון אפשרי, יש להעמיד חוזה שירות (SLA) המגדיר את רמת השירות וזמני התאוששות ממימוש הסיכון (=משבר).

מודיעין: כנגזרת מהגדרת הסיכונים, ניטור כל הפרמטרים היכולים לנבא משבר ותרגום כל המנבאים לפעיולות מנע שגרתיות.

תיאום משאבים לציפיות (SLA): כנגזרת מהגדרת הסיכונים, ניהול זמינות משאבים קריטיים לפתרון משברים אפשריים. בין אם אלה עובדי החברה או ספקים חיצוניים, החוזה מולם צריך להיות תואם את הציפיות (SLA) עם המשתמשים.

מוכנות: מנמ"ר שלא ערוך למשברים ולתקלות, לא עושה את עבודתו נאמנה. על כן מנמ"ר צריך להגיע ליום עבודה מתוך הבנה שהיום – יהיה משבר.

התנהלות הארגון

אפשר בקלות להבחין בין שני סוגי ארגונים:

1. ארגונים השואפים ליציבות. עבורם כל משבר הוא מפתיע ועמוק. יציאה ממנו היא כולה שאיפה של חזרה ליציבות.

2. ארגונים דינאמיים ששיווי המשקל שלהם, בדומה לרכיבה על אופניים, נובע מתנועה בין משבר למשבר.

אם נתון שכל שינוי בשירות בהכרח מייצר חוסר יציבות, הארגון צריך לסווג את עצמו בין שני הסוגים. שהרי אם הוא מהסוג הראשון, הארגון חייב להפחית שינויים.

אבל אם הארגון הוא מהסוג השני, הוא צריך לנהל את השינויים כך שקצב המעבר בין משבר למשבר תואם את הקיבולת הארגונית. כלומר מבנה הארגון ובכלל זה מערכות מידע, ובתוך זה ההסכמים עם הספקים, מאפשרים תנועה ממשבר למשבר באופן מנוהל (!) ובהתאם לציפיות. והארגון מסוגל להכיל את קצב השינויים.

סביר שחלק גדול יותר מהארגונים המודרנים, חושבים על עצמם שהם דימאמיים ושואפים להתקדם. האם הם באמת בנויים בהתאם?

התנהלות המנמ"ר בעת המשבר

בעת משבר, המנמ"ר וצוותו אמורים להמצא באיזור הנוחות!

עיקר המשימה היא להוות גורם מנהל, המוריד רעשים, ממקד את הצוותים במשימות, היצמדות לנוהל העבודה, והפעלת "כוחות ומשימות" באופן אחראי ובתאם לציפיות.

בכדי להתנהל באופן שקול, אסור למנמ"ר להיות מופתע. הוא חייב להיות מוכן. ועל זה נאמר: "מי שטרח בערב שבת..."

סיום המשבר חייב לכלול את הפקת הלקחים, כי אם לא הופקו לקחים, ולא הוטמעו בתהליכי העבודה, התקלה תחזור באדרת אחרת.

לסיכום

משימתו של המנמ"ר בארגון המתבסס על מערכות קיימות, היא להיערך למשבר, לוודא שכל הצוותים ערוכים ומוכנים לתרחישים בעיתיים ובעת משבר מוכנים להסתער על כל בעיה.

ככל שהארגון מתקדם יותר, מתפתח יותר וחווה גדילה מבורכת, כך ניהול משברים הופך לחלק אינטגרלי משגרת יומו.