تجزیه و تحلیل روند بازار سهام با استفاده از مدل مخفی مارکوف و حافظه کوتاه مدت بلند مدت

ساخت وبلاگ

Mingwen Liu A ∗ ، Junbang Huo B ، Yulin Wu B ، Jinge Wu C *نویسنده مربوطه. آدرس ایمیل: یک دانشکده تجاری ، دانشگاه Sun Yat-Sen ، Guangzhou ، Pr China B دانشکده ریاضیات ، دانشگاه Sun Yat-Sen ، Guangzhou ، Pr China C Dollegy of Science ، Xian Jiaotong-Liverpool ، Suzhou ، PR China

خلاصه

در این مقاله قصد دارد مدل مخفی مارکوف را در بازار سهام اعمال کند و پیش بینی کند. علاوه بر این ، چهار روش مختلف بهبود ، که شامل GMM-HMM ، XGB-HMM ، GMM-HMM+LSTM و XGB-HMM+LSTM هستند ، بعداً با نتایج آزمایش مورد بحث قرار می گیرند. پس از آن ما جوانب مثبت و منفی مدل های مختلف را تجزیه و تحلیل خواهیم کرد. و سرانجام ، یکی از بهترین ها برای استراتژی زمان بندی در بازار سهام مورد استفاده قرار می گیرد.

کلمات کلیدی: HMM ، GMM ، XGBOOST ، LSTM ، پیش بینی قیمت سهام.

مقدمه

HMM و LSTM در سالهای اخیر به طور گسترده ای در زمینه تشخیص گفتار مورد استفاده قرار گرفته اند که دقت سیستم های تشخیص گفتار موجود را تا حد زیادی بهبود بخشیده است. بر اساس بسیاری از شباهت ها بین تشخیص گفتار و پیش بینی سهام ، این مقاله ایده استفاده از HMM و LSTM را در بازارهای مالی پیشنهاد کرده و از الگوریتم های یادگیری ماشین برای پیش بینی فراز و نشیب های بورس استفاده می کند. ما تأثیر مدل را از طریق آزمایشات بررسی کردیم. ابتدا از روش مدل هیبریدی GMM-HMM استفاده می کنیم. سپس ، مدل HMM را با استفاده از الگوریتم XGB (XGB-HMM) بهبود بخشید. در مرحله بعد ، ما یک مدل حافظه با اصطلاح طولانی (LSTM) ایجاد می کنیم ، سپس از GMM-HMM و LSTM با هم استفاده می کنیم ، همچنین نتایج را با XGB-HMM و LSTM مقایسه می کنیم. با مقایسه نتایج چهار آزمایش ، مدلی که برای بازار سهام مناسب است خلاصه و کاربردی خواهد بود. در این مقاله هسته اصلی هر الگوریتم و عملکرد عملی توضیح داده شده است و کدهای اصلی آزمایش ها منبع باز برای مرجع و یادگیری در GitHub خواهند بود. 1 1 1 https://github.com/jingewu/stock-market-trend-analysis-using-hmm-lstm.

فرآیند داده دوم

ویژگی II-A

ساخت ii-a1 از ویژگی y

اول ، ما باید یک ویژگی y ایجاد کنیم که بتواند روند بازار سهام را منعکس کند تا پیش بینی فراز و نشیب های قیمت سهام را پیش بینی کند. بنابراین روشی به نام روش سد سه گانه [5] می تواند به خوبی در این شرایط استفاده شود. روش سد سه گانه برای اولین بار توسط مارکوس مطرح شده است ، که یک روش برچسب زدن جایگزین است (در شکل 1 مراجعه کنید).

the triple barrier method [Fig. 1: the triple barrier method [5]

نشانه گذاری
T: طول توالی مشاهده
N: تعداد حالتهای موجود در مدل
M: تعداد نمادهای مشاهده
پاسخ: احتمالات انتقال دولت
ب: ماتریس احتمال انتشار
π: توزیع حالت اولیه
O = : توالی مشاهده
S = : دنباله حالت
V = : مجموعه ای از مشاهدات احتمالی
λ = (A ، B ، π): مدل HMM
s o c r e _ p l o t: عملکرد نمره

جدول I: یادداشت

این سه خط تقسیم بندی را تنظیم می کند و آنها را مطابق با اولین سدی که توسط مسیر لمس شده است ، علامت گذاری می کند. ابتدا دو موانع افقی و یک سد عمودی را تعیین می کنیم. دو موانع افقی با محدودیت سود و متوقف کردن ضرر تعریف می شوند ، که یک عملکرد پویا از نوسانات تخمین زده شده (چه تحقق یافته یا ضمنی) است. سد سوم از نظر تعداد میله های سپری شده از زمان گرفتن موقعیت (محدودیت انقضا) تعریف شده است. اگر ابتدا سد فوقانی لمس شود ، ما مشاهده را به عنوان 1 نشان می دهیم. اگر ابتدا سد پایین لمس شود ، ما مشاهده را به عنوا ن-1 نشان می دهیم. اگر ابتدا سد عمودی لمس شود ، مشاهده را به عنوان 0 نشان می دهیم (در شکل 2 نشان داده شده است). روش سد سه گانه می تواند برای برچسب قیمت آینده سهام مفید باشد.

three different status of the triple barrier method [

شکل 2: سه وضعیت متفاوت از روش سد سه گانه [5]

یکی از مشکلات روش سه گانه-پیشرو وابسته به مسیر است. برای برچسب زدن یک مشاهده ، ما باید کل مسیر را در نظر بگیریم [t i 0 ، t i 0 + h] ، جایی که H سد عمودی (حد انقضا) را تعریف می کند. ما T I 1 را به عنوان زمان اولین لمس سد بیان می کنیم و بازده مرتبط با ویژگی مشاهده شده T I 0 ، T I 1 است. به خاطر وضوح ، T I 1 ≤ T I 0 + H ، و موانع افقی لزوماً متقارن نیستند.

ساخت II-A2 دنباله مشاهده

داده های ما از دنباله مشاهده به 8 نوع مختلف تقسیم می شود:

نوع معنی
عامل بازار قیمت قبل از بسته شدن ، قیمت نزدیک قیمت باز ،
  مبلغ معامله و غیره
عامل کیفیت 50 عامل مانند نسبت قابل پرداخت حساب ،
  روزهای گردش مالی ، هزینه های مدیریت
  و کل درآمد عملیاتی
عامل خطر درآمد 10 عامل مانند درآمد تجمعی و
  نوسان در حال سقوط
عامل ارزش 13 عامل مانند نسبت ارزش بازار جریان نقدی ،
  نسبت ارزش بازار درآمد ، نسبت قیمت به کتاب
  و نسبت قیمت درآمد
عامل خلق 49 عامل مانند نرخ گردش مالی دست
  حجم معاملات پویا و تجارت
شاخص 49 عامل مانند میانگین متحرک نمایی
  و صاف کردن شباهت متوسط حرکت
عامل حرکت 56 عامل مانند درآمد سهام
  و خط تجمع/توزیع
عامل افزایش 17 عامل مانند نرخ رشد دارایی خالص
  و نرخ رشد سود خالص

به منظور طبقه بندی انواع مختلف دنباله مشاهده ، از یک تابع نمره برای ارزیابی این ویژگی ها و انتخاب قدرتهای قدرتمند در مدل استفاده می کنیم. لطفاً به جدول اول به عنوان اعلامیه نمادهای مورد استفاده در این مقاله مراجعه کنید.

یک فاکتور F را برطرف کنید ، فرض کنید داده های روزانه F ، مدل GMM-HMM را قطار کنید و با استفاده از الگوریتم ViterBI ، توالی حالت بهینه را تولید کنید.

یک ماتریس شمارش m ایجاد کنید ، جایی که m ∈ R n × 3 ، که در آن m i j نمایانگر فرکانس برچسب J مربوط به حالت i است ، جایی که i ∈<0 , 1 , . . . , N − 1>، j ∈<− 1 , 0 , 1>ساخت ماتریس نسبت شمارش M R مطابق با M ،

تجارت با گزینه‌‌های باینری...
ما را در سایت تجارت با گزینه‌‌های باینری دنبال می کنید

برچسب : نویسنده : نازنین فراهانی بازدید : 45 تاريخ : سه شنبه 16 خرداد 1402 ساعت: 13:36