در این مطالعه جهت آموزش مدل، داده ها به دوسته آموزش و آزمون تقسیم شدند. در مطالعات اخیر مشخص شده است که نحوهی تقسیم مجموعهی داده به دو زیر مجموعهی آموزش و آزمون تاثیر بسزایی بر نتیجه دارد. همانند تمام مدلهای تجربی، مدلهای محاسبات نرم قادر به برون یابی خارج از محدودهی دادههای آموزش نمیباشند. بنابراین لازم است دادهها به گونهای تفکیک شوند که ضمن تصادفی بودن، از نظر پارامترهایی چون میانگین، انحراف معیار، مینیمم و ماکزیمم به هم نزدیک باشند. علت دیگر اهمیت این موضوع آناست که جهت شبیهسازی مدل با دادههای آزمون، لازم است دادهها بر اساس مشخصات دادههای آموزش نرمالایز شوند. به همین منظور چندین ترکیب تصادفی برای تفکیک مجموعههای آموزش و آزمون انتخاب شدند تا نهایتا دو مجموعه که از نظر آماری با هم سازگاری داشتند بدست آمدند.
در مراجع مختلف تقسیم داده ها به آموزش و آزمون به دو صورت ۸۰ به ۲۰ و ۷۰ به ۳۰ صورت میپذیرد و انتخاب هر یک از این روش بستگی به تعداد داده ها و ورودی ها دارد که در این مطالعه، ۸۰% از مجموعه داده برای آموزش(۱۳۴۷ داده) و ۲۰% از مجموعه داده (۳۳۷ داده) برای آزمون مدل پیشنهادی استفاده شده است. با توجه به فراونی داده ها، جهت آموزش مدل ها سعی شد داده های آموزش به دسته های ۲۰۰، ۴۰۰، ۶۰۰، ۸۰۰، ۱۰۰۰ و ۱۳۴۷ تایی تقسیم و مرحله آموزش انجام شود تا بدین صورت حداقل مقدار داده که منجر به نتایج مناسب می شود، مشخص شود. با توجه به پراکندگی مقادیر دادهها برای آموزش مدل، سعی شد ابتدا دادههای آموزشی با یکی از روشهای نرمالایز کننده، به صورت استاندارد در آیند [۲۶-۲۷]. به این صورت که مقادیر هر پارامتر به ماکزیمم مقدار آن پارامتر تقسیم میشدند تا بدین صورت دادهها استاندارد شوند.
در جدول (۴- ۱) متغیرهای ورودی و خروجی بکار رفته در مدل شبکهی عصبی(ANN) به همراه پارامترهای آماری مربوط به دو مجموعه دادهی آموزش و آزمون ارائه شدهاند.
-
-
-
- ساختار مدل شبکه عصبی پیشنهادی
-
-
در مسائل پیچیده که ارتباط بین متغیرها ناشناخته میباشد، شبکهی عصبی مصنوعی یک ابزار قوی برای پیش بینی پدیده ها میباشد. در این قسمت به منظور روشن شدن تأثیر پارامترهای مختلف و دست یابی به روشی برای تخمین فشار پیزومتری، یک مدل شبکهی عصبی (ANN) با ۵ پارامتر ورودی شامل؛ مختصات محل قرارگیری پیزومترها (X, Y, Z)، نسبت فاصله زمانی و سطح آب پشت سد، در نرم افزار متلب ایجاد شده است.
به این ترتیب یک مدل شبکهی عصبی مصنوعی چند لایهی پیش خور، با ۶ نرون در لایهی پنهان و تنها یک نرون خروجی که فشار پیزومتری میباشد، فراهم گردیده است. در مورد تعداد لایهیهای پنهان و همچنین تعداد نرونهای آنها باید از طریق سعی و خطا به بهینهترین حالت رسید. شبکهای مطلوبتر است که با کمترین لایههای پنهان و کمترین نرون بتواند جوابهای دقیقتری ارائه دهد و جوابهای آن با فیزیک مسئله سازگار باشد.
متداولترین روش برای یافتن بهینهترین ترکیب وزنهای شبکههای پیش خور، الگوریتم پس انتشار میباشد که بر اساس کاهش مشتق اول عمل می کند. شبکههای عصبی پیش خور آموزشدیده با الگوریتم پس انتشار، به طور گستردهای در زمینههای مختلف مهندسی ژئوتکنیک قبلاً بکارگرفته شده اند و موفقیتهایی را کسب کردهاند. به عنوان مثال در این زمینه میتوان به کارهای گه در زمینه پتانسیل روانگرایی به وسیله شبکه عصبی، در زمینه ارزیابی گسترش جانبی [۵۲]به کمک شبکه عصبی، ارزیابی پتانسیل روانگرایی با بهره گرفتن از نتایج CPT در زمینه پیش بینی نشست در پیهای سطحی با بهره گرفتن از شبکه عصبی و بسیاری از تحقیقات دیگر در این زمینه اشاره نمود.
از آنجا که الگوریتم پس انتشار، از مینیمم کردن مشتق اول برای تعیین وزنهای ارتباطی شبکه استفاده میکند، اگر حدسهای اولیه برای وزنها مناسب نباشند، امکان دارد روند بهینهیابی در مینیمم موضعی گرفتار شود. به همین دلیل در این مطالعه، مرحلهی آموزش به منظور پیدا کردن بهینهترین شبکه به دفعات با مشخصات متفاوتی برای لایه و یا لایههای پنهان تکرار شده است.
عملکرد شبکه برای برگزیدن بهترین جواب، توسط پارامترهای آماری ضریب تعیین (R2) و ریشه میانگین مربعات خطا (RMSE) بر روی هر دو مجموعه دادهی آموزش و آزمون کنترل میگردید، تا اینکه پس از سعی و خطای بسیار، بهینهترین شبکه با تنها یک لایهی میانی حاوی ۶ نرون و تابع انتقال تانژانت هیپربولیکی برای هر ۲ انتقال از لایهی ورودی به میانی و میانی به خروجی بدست آمد.
پارامترهای آماری مربوط به دادههای آموزش و آزمون
Parameter | Statistic | Training data |
Test data |
X(m) | Max | ۵۶ | ۵۶ |
Mean | ۲۸.۸۶ | ۲۶.۱۹ | |
Min | -۳۴ | -۳۴ | |
Std Dev | ۲۴.۴۷ | ۲۸.۸۸ |