۱ Begin
۲ for each s ∈ S do
۳ total = 0
۴ for each p ∈ S do
۵ total = total+ dist(s_p) //dist(s_p), Euclidean distance between s and p
۶ end for
۷ = total / (|S|-1)/n // the self radius of the sample s
۸ end for
شکل ۰‑۱: الگوریتم تعیین شعاع متغیر برای نمونههای خودی در الگوریتم پیشنهادی(زنگ و همکاران ، ۲۰۱۳).
۴-۲-۱-۲- تولید شناساگر با شعاع متغیر
در فاز آموزش، شناساگرهای کاندید به طور تصادفی تولید می شوند و سپس توسط نمونههای خودی آموزش داده می شوند تا شناساگرهای خودی حذف شده و در نهایت مجموعه ای از شناساگرهای غیر خودی به دست آید. روند فاز آموزش به صورت زیر است:
تمام نمونههای خودی مجموعه S را به فاصله اقلیدسی نرمال میکنیم،
هر نمونه خودی به صورت است، که مرکز و شعاع نمونه خودی است؛
برای پوشش ناحیه غیرخودی، شناسگر کاندید به مرکز به صورت تصادفی انتخاب میشود،
اگر این داده تصادفی توسط یکی از نمونههای خودی شناخته شود، بدین ترتیب که ، در این زمان داده کاندید حذف میشود،
در غیر این صورت، کمینه فاصله از داده کاندید تا همه نمونههای خودی محاسبه میشود، به عنوان شعاع داده کاندید درنظر گرفته میشود،
نهایتا مولفهبه مجموعه شناسگرهای Dافزوده میشود،
این روند تا کامل شدن تعداد شناسگرها ادامه می یابد.
همان طور که در شکل ۴-۸ ملاحظه می کنید ،در الگوریتم V-detector تولید شناساگرها با شعاع متغیر، طبق مراحل توضیح داده شده در بالا انجام می پذیرد.
شکل ۴-۸- الگوریتم تولید شناساگر با شعاع متغیر (V-detector )(جی آی و داسکوپتا ، ۲۰۰۴).
۴-۲-۱-۳- شناسایی و نگهداری نمونههای خودی مرزی
در مکانیسم سرکوب ایمنی ، داده های نرمال یا همان نمونههای خودی مورد آزمایش ، به دو دسته تقسیم می شوند: نمونه های نرمال مرزی و نمونههای نرمال غیر مرزی. در طول فاز آموزش، نمونههای نرمال مرزی می بایست شناسایی و نگهداری شوند. در فاز کشف شناساگرهای غیر نرمال تولید شده به عنوان سلولهای Th کار کشف را انجام می دهند و نمونههای نرمال مرزی به عنوان سلول های Tsبرای سرکوب کردن سلول هایT غیر فعال وارد عمل می شوند. چنانچه در قسمت قبل شرح داده شد با این روش شناساگرهای کمتری برای پوشش فضای غیرنرمال می توانند مورد استفاده قرار گیرند و نیز تعداد حفره ها کاهش می یابد. بنابر این در الگوریتم پیشنهادی گام شناسایی و نگهداری نمونههای خودی مرزی در فاز آموزش، پس از گام تولید شناساگرها، اضافه می شود. یافتن نمونه های نرمال مرزی کار دشواری نیست. درگام قبلی یعنی به هنگام تولید شناساگرها، برای تعیین شعاع هر شناساگر لازم است فاصله شناساگر با نزدیکترین نمونه خودی به آن شناساگر، محاسبه شده که این فاصله به عنوان شعاع شناساگر در نظر گرفته می شود. نزدیکترین نمونههای خودی به شناساگرها همان نمونه های خودی مرزی هستند. پس به هنگام تولید شناساگرها نمونههای خودی مرزی شناسایی می شوند. حال باید در این مرحله امکانی برای نگهداری این نمونه های خودی مرزی فراهم گردد تا در فاز تشخیص، از آنها به عنوان سلول های Tsبرای سرکوب کردن سلول های Tغیر فعال استفاده شود.
با جمع بندی مطالب فوق، فلوچارت فاز آموزش الگوریتم پیشنهادی در این بخش، در شکل ۴-۹ نشان داده شده است. همانطور که در شکل مشاهده می کنید لازم است نمونه های خودی مرزی در فاز آموزش شناسایی شده و برای استفاده در فاز تشخیص آنها را نگهداری کنیم. به همین منظور یک گام جدید به فاز آموزش اضافه شده است .
شکل ۴-۹- فاز آموزش الگوریتم پیشنهادی
۴-۲-۲- فاز تشخیص
شناساگرهای آموزش دیده در فاز آموزش و داده های نرمال مرزی شناسایی شده در فاز آموزش، برای تشخیص داده های غیرنرمال و ناهنجار در فاز تشخیص بار می شوند. در راهکار پیشنهاد شده، فاز تشخیص دارای دو مرحله می باشد. مرحله اول شامل آزمایش داده ورودی با شناساگرها می باشد ( که در تمام الگوریتم های انتخاب منفی مرسوم است ) و مرحله دوم آزمایش داده ورودی با نمونه های نرمال مرزی است. ابتدا داده ورودی با مجموعه شناساگرهای آموزش دیده در فاز آموزش، چک می شود. چنانچه با هیچ یک از شناساگرهای موجود تطابق نداشته باشد به این معناست که داده ورودی نرمال است. چنانچه داده ورودی با هریک از شناساگرها انطباق یافت مکانیسم تشخیص وارد مرحله دوم شده و داده ورودی برای بار دوم با نمونههای نرمال مرزی چک می شود. اگر با هیچ یک از نمونههای نرمال مرزی انطباق نداشت، به این معناست که داده غیرنرمال و ناهنجار است.
فرایند تشخیص شامل مراحل زیر است :
شناساگرها و نمونههای خودی مرزی به دست آمده از فاز آموزش به فاز تشخیص انتقال داده می شوند .
نمونه داده جدید t از ورودی خوانده میشود.
اگر t توسط هیچ یک از شناساگرهای مجموعه D شناسایی نشود، آنگاه این داده یک داده عادی است .
اگر t توسط یکی از شناساگرهای مجموعه D شناسایی شود، بدین معنا که
باشد،(که شعاع و مرکز شناساگر است) آنگاه می بایست در گام بعدی توسط نمونه های خودی مرزی، مجددا مورد آزمایش قرار گیرد .
اگر نمونه ورودی با یکی از نمونه های خودی مرزی شناسایی شود، یعنی:
باشد (که شعاع و مرکز نمونه خودی مرزی است )، آنگاه این داده به عنوان داده عادی شناسایی میشود؛
اگر داده ورودی با هیچ یک از نمونههای نرمال مرزی شناسایی نشود، آنگاه داده ورودی یک داده غیر نرمال و ناهنجار است.
بر اساس مطالب گفته شده ، فاز تشخیص الگوریتم پیشنهاد شده در شکل ۴-۱۰ نمایش داده شده است. همانطور که در شکل ۴-۱۰ آمده است، فاز تشخیص الگوریتم جدید شامل دو مرحله می باشد. در مرحله اول داده ورودی با شناساگرها آزمایش می شود. اگر با یکی از شناساگرها شناسایی شود وارد مرحله بعدی یعنی آزمایش با نمونه های خودی مرزی می گردد.
شکل ۴-۱۰- فلوچارت فاز تشخیص الگوریتم انتخاب منفی پیشنهادی
۴-۳- جمع بندی
در این بخش یک الگوریتم انتخاب منفی بهبود یافته با هدف بهبود عملکرد ارائه گردید. در بیشتر الگوریتمهای انتخاب منفی، شعاع نمونههای خودی ثابت در نظر گرفته شده است ولی همان طور که گفته شد این روش نمیتواند مشخصات مناسبی از سیستم را ارائه دهد. تعریف شعاع خودی متغیر میتواند پوشش خوبی از ناحیه خودی را فراهم کند و نیز مشخصات سیستم را به خوبی بیان کند. آزمایشات نشان میدهد که شناساگرهای تولید شده با این روش نرخ تشخیص[۱۸۷] بالا و نرخ هشدار غلط[۱۸۸] پایینی دارد.
در راهکار پیشنهادی علاوه بر تعریف شناساگرها با قابلیت شعاع متغیر، نمونههای خودی نیز با شعاع متغیر در نظر گرفته شده اند. همچنین در این روش از استراتژی سرکوب ایمنی استفاده شده که موجب کاهش حفرهها و پایین آمدن تعداد شناساگرهای لازم جهت پوشش دهی ناحیه غیرخودی می گردد. در مکانیسم سرکوب ایمنی، نمونههای خودی مرزی با شناساگرها ترکیب شده و موجب فراهم شدن پوشش بهینهتری از ناحیه غیرخودی و ارتقای قدرت تشخیص الگوریتم انتخاب منفی می گردد. در مجموع راهکار پیشنهاد شده تلفیقی است از الگوریتمهای تولید شناساگر با شعاع متغیر و تعریف نمونههای خودی با شعاع متغیر ، و نیز به کارگیری مکانیسم سرکوب ایمنی با بهره گرفتن از نمونههای خودی مرزی به عنوان سلولهای ایمنی سرکوبگر .
در فصل بعد راهکار پیشنهاد شده در این فصل را مورد آزمایش قرارداده و به ارزیابی نتایج حاصل شده خواهیم پرداخت .