文章目錄[隱藏]
- 那這些算法都是什麽,該怎麽用?下麵就挑幾個算法給大家講解下教程。
- 1、層次分析法
- 2、TOPSIS(優劣解距離法)
- 3、模糊綜合評價
- 4、灰色關聯分析
- 5、秩和比綜合評價
- 6、數據包絡分析
- 7、時間序列(ARIMA模型)
- 8、灰色預測模型GM(1,1)
- 9、決策樹
- 10、xgboost
距離2023年國賽僅(jin) 有不到兩(liang) 個(ge) 月的時間,你準備的怎麽(me) 樣了?
第一次參加國賽,如何從(cong) 零開始準備?
在團隊中擔任建模手,應該儲(chu) 備哪些模型?
數學建模的步驟及論文寫(xie) 作,有哪些實用技巧?
今天就跟大家講講,國賽備戰都需要準備什麽(me) ?
全國大學生數學建模競賽是世界上規模最大的數學建模競賽,一等獎對於(yu) 想保研或衝(chong) 獎學金的同學來說都是強有力的加分項,因此每年國賽數模競賽往往高手如雲(yun) ,競爭(zheng) 激烈!也有很多小夥(huo) 伴第一次參加國賽不知道怎麽(me) 入手?今天就跟大家講下如何在短期內(nei) 備戰國賽。
首先你要清楚你擅長的是那種類型的建模,數模題目是分多種類型的,知道自己的方向再去深度學習(xi) 做準備,才是最快速有效的方法。
那麽(me) 目前數模比賽主要分為(wei) 哪幾種呢,如下:
根目前建模類大體(ti) 分為(wei) 以上4種,如果是小白建模選手可看往年的比賽論文決(jue) 定自己感興(xing) 趣的題型方向,根據感興(xing) 趣方向積累算法模型及數學知識。
預測類及評價(jia) 類相對容易拿獎、可以提前學習(xi) 一些常用的分析模板,如:灰色預測、層次分析、時間序列、回歸預測等,下麵會(hui) 講下這幾個(ge) 算法的使用,適合小白入手數模比賽拿獎。
機理加優(you) 化類則需要有較強的數學功底,利用數學知識建模再數學求解,這種適合有一定數模經驗的人群。
模型儲(chu) 備主要是指參賽隊的數學基礎,對常見模型、方法的理解,以及靈活運用這些知識的熟練程度。熟練掌握的模型越多,解決(jue) 問題時的眼界越開闊,可選擇的方法也越多。
而對於(yu) 很多剛入門的小夥(huo) 伴,去儲(chu) 備整一套數模知識在短期內(nei) 是不太科學的,那麽(me) 想要短期上手衝(chong) 刺獎項,其實隻要掌握一些常用的模型就足矣。以下就是比賽種最常用的模型有哪些呢(必收藏!賽前學習(xi) 必備)
那這些算法都是什麽,該怎麽用?下麵就挑幾個算法給大家講解下教程。
1、層次分析法
層次分析法是一種解決(jue) 多目標的複雜問題的定性與(yu) 定量相結合的決(jue) 策分析方法。該方法將定量分析與(yu) 定性分析結合起來,用決(jue) 策者的經驗判斷各衡量目標之間能否實現的標準之間的相對重要程度。
輸入輸出描述 輸入:根據提示進行指標或者方案兩(liang) 兩(liang) 對比
輸出:各方案的量化得分或者同一級的指標權重
案例:通過構建評價(jia) 指標(景色、費用,居住,飲食、旅途)對候選旅遊地(桂林、黃山,北戴河)量化評價(jia) ,進行選擇。(這裏層次分析法簡化版主要針對評價(jia) 指標(景色、費用,居住,飲食、旅途)的權重建立分析)
案例操作
step1:選擇【層次分析法(AHP簡化版)】;(注意:在spsspro計算指標權重時用到的時方根法)
step2:選擇判斷矩陣階層(注意:準則層有多少因素,那麽(me) 判斷矩陣階層就是多少。在本例中,準則層包括景色、費用、居住、飲食、旅途,所以判斷矩陣階層是5)
step3:設置判斷矩陣(判斷矩陣是對稱矩陣),判斷矩陣的元素 表示的是第 個(ge) 因素相對於(yu) 第 個(ge) 因素重要性比較結果,比如a21=2,是指費用的重要性會(hui) 比景色的重要性更大。點擊開始分析,即可輸出完成的分析報告及結果。
2、TOPSIS(優劣解距離法)
TOPSIS 法是一種常用的組內(nei) 綜合評價(jia) 方法,能充分利用原始數據的信息,其結果能精確地反映各評價(jia) 方案之間的差距。基本過程為(wei) 基於(yu) 歸一化後的原始數據矩陣,采用餘(yu) 弦法找出有限方案中的最優(you) 方案和最劣方案,然後分別計算各評價(jia) 對象與(yu) 最優(you) 方案和最劣方案間的距離,獲得各評價(jia) 對象與(yu) 最優(you) 方案的相對接近程度,以此作為(wei) 評價(jia) 優(you) 劣的依據。該方法對數據分布及樣本含量沒有嚴(yan) 格限製,數據計算簡單易行。
輸入輸出描述 輸入:至少兩(liang) 項或以上的定量變量。
輸出:反應考核指標在量化評價(jia) 中的綜合得分
案例:為(wei) 了客觀地評價(jia) 各風景地點的性價(jia) 比,根據風景、人文、擁擠程度、票價(jia) 等因素對各風景地點進行評估。
案例操作
step4:選擇【優(you) 劣解距離法(TOPSIS)】;
step5:查看對應的數據數據格式,【優(you) 劣解距離法(TOPSIS)】要求特征序列為(wei) 定量變量,分為(wei) 正向指標變量和負向指標變量,且正向指標變量和負向指標變量的個(ge) 數之和大於(yu) 等於(yu) 兩(liang) 項。
step6:設置變量權重(熵權法、不設置權重)。
step7:點擊【開始分析】,完成全部操作。
3、模糊綜合評價
模糊綜合評價(jia) 借助模糊數學的一些概念,對實際的綜合評價(jia) 問題提供評價(jia) ,即模糊綜合評價(jia) 以模糊數學為(wei) 基礎,應用模糊關(guan) 係合成原理,將一些邊界不清、不易定量的因素定量化,進而進行綜合性評價(jia) 的一種方法。
輸入輸出描述 輸入:至少兩(liang) 項或以上的定量變量。
輸出:反應考核指標在量化評價(jia) 中的綜合得分。
案例:某飲食行業(ye) 品牌發布一款新零食,欲了解消費者對該種零食的接受程度。一共有五個(ge) 評價(jia) 指標(分別是價(jia) 格、味道、包裝、營養(yang) 與(yu) 性價(jia) 比),以及評語共有四項(分別是很歡迎,歡迎,一般,不歡迎)。
案例操作
step4:選擇【模糊綜合評價(jia) 】;
step5:查看對應的數據數據格式,【模糊綜合評價(jia) 】求輸入數據為(wei) 放入 [定量] 自變量X(變量數≥2)。
step6:設置變量權重(熵權法、不設置權重)、模糊算子(主因素決(jue) 定型、主因素突出型、取小與(yu) 有界型、加權平均型)。
step7:點擊【開始分析】,完成全部操作。
4、灰色關聯分析
對於(yu) 兩(liang) 個(ge) 係統之間的因素,其隨時間或不同對象而變化的關(guan) 聯性大小的量度,稱為(wei) 關(guan) 聯度。在係統發展過程中,若兩(liang) 個(ge) 因素變化的趨勢具有一致性,即同步變化程度較高,即可謂二者關(guan) 聯程度較高;反之,則較低。
因此,灰色關(guan) 聯分析是指對一個(ge) 係統發展變化態勢的定量描述和比較的方法,其基本思想是通過確定參考數據列和若幹個(ge) 比較數據列的幾何形狀相似程度來判斷其聯係是否緊密,它反映了曲線間的關(guan) 聯程度。
輸入輸出描述 輸入:特征序列為(wei) 至少兩(liang) 項或以上的定量變量,母序列(關(guan) 聯對象)為(wei) 1項定量變量。
輸出:反應考核指標與(yu) 母序列的關(guan) 聯程度。
案例:分析09-18年內(nei) ,影院數量,觀影人數,票價(jia) 、電影上線數量這些因素對全年電影票房的影響。其中電影票房是母序列,影院數量,觀影人數,票價(jia) 、電影上線數量是特征序列。
案例操作
step4:選擇【灰色關(guan) 聯分析】;
step5:查看對應的數據數據格式,【灰色關(guan) 聯分析】要求特征序列為(wei) 定量變量,且至少有一項;要求母序列為(wei) 定量變量,且隻有一項。
step6:設置量綱處理方式(包括初值化、均值化、無處理)、分辨係數(ρ越小,分辨力越大,一般ρ的取值區間為(wei) ( 0 ,1 ),具體(ti) 取值可視情況而定。當 ρ ≤ 0.5463時,分辨力最好,通常取 ρ = 0.5 )
step7:點擊【開始分析】,完成全部操作。
5、秩和比綜合評價
秩和比(RSR)指將效益型指標從(cong) 小到大排序進行排名、成本型指標從(cong) 大到小排序進行排名,再計算秩和比,最後統計回歸、分檔排序。通過秩轉換,獲得無量綱統計量RSR,以RSR值對評價(jia) 對象的優(you) 劣直接排序或分檔排序,從(cong) 而對評價(jia) 對象做出綜合評價(jia) 。
輸入輸出描述 輸入:至少兩(liang) 項或以上的定量變量。
輸出:反應考核指標在量化評價(jia) 中的綜合得分與(yu) 分檔
案例:對某省10個(ge) 地區的孕婦保健工作的三個(ge) 指標進行綜合評價(jia)
案例操作
step4:選擇【秩和比綜合評價(jia) 法】;
step5:查看對應的數據數據格式,【秩和比綜合評價(jia) 法】要求特征序列為(wei) 定量變量,分為(wei) 正向指標變量和負向指標變量,且正向指標變量和負向指標變量的個(ge) 數之和大於(yu) 等於(yu) 兩(liang) 項。
step6:設置編秩方式(非整秩方法(推薦使用)、整秩方法、無處理)、分檔數量(3檔、4檔、5檔 )、變量權重(熵權法、不設置權重、自定義(yi) 權重)。
step7:點擊【開始分析】,完成全部操作。
6、數據包絡分析
數據包絡分析是評價(jia) 多輸入指標和多輸出指標的較為(wei) 有效的方法,將多投入與(yu) 多產(chan) 出進行比較,得到效率分析,可廣泛使用於(yu) 業(ye) 績評價(jia) 。
輸入輸出描述 輸入:數據包絡分析的輸入是投入、產(chan) 出的指標(定量變量)。
輸出:效率評估結果,包含具體(ti) 需要增大或減小哪些投入變量,如何調整產(chan) 出變量,才能達到最優(you) 效率
案例:投入變量為(wei) :政府財政收入占 GDP 的比例、環保投資占 GDP 的比例、每千人科技人員數/人。產(chan) 出變量為(wei) :人均 GDP、城市環境質量指數。試分析投入產(chan) 出效率,得出如何調整投入變量和產(chan) 出變量,才能達到最優(you) 效率。
案例操作
step4:選擇【數據包絡分析】;
step5:查看對應的數據數據格式,【數據包絡分析】要求先放入投入指標(>=1 的定量變量),再放入產(chan) 出指標(>=1 的定量變量),最後放入索引項(<=1 的定類變量)。
step6:設置 DEA 類型(規模報酬不變(CCR)or 規模報酬可變(BBC)),例子中選擇規模報酬可變模型(BBC)。
step7:點擊【開始分析】,完成全部操作。
7、時間序列(ARIMA模型)
ARIMA模型的全稱叫做自回歸移動平均模型,是統計模型中最常見的一種用來進行時間序列預測的模型。
輸入輸出描述 輸入:特征序列為(wei) 1個(ge) 時間序列數據定量變量
輸出:未來N天的預測值
案例:基於(yu) 1985-2021年某雜誌的銷售量,預測某商品的未來五年的銷售量。
案例操作
step4:選擇【時間序列分析(ARIMA)】;
step5:查看對應的數據數據格式,【時間序列分析(ARIMA)】要求輸入1個(ge) 時間序列數據定量變量。
step6:選擇向後預測的期數。
step7:點擊【開始分析】,完成全部操作。
8、灰色預測模型GM(1,1)
灰色預測是一種對含有不確定因素的係統進行預測的方法。灰色預測通過鑒別係統因素之間發展趨勢的相異程度,即進行關(guan) 聯分析,並對原始數據進行生成處理來尋找係統變動的規律,生成有較強規律性的數據序列,然後建立相應的微分方程模型,從(cong) 而預測事物未來發展趨勢的狀況。
輸入輸出描述 輸入:1個(ge) 時間序列數據定量變量
輸出:灰色預測的擬合預測結果
示例:基於(yu) 某雜誌 2006-2021 年某產(chan) 品的年銷售量,使用灰色預測模型對未來三年銷售量進行預測。
案例操作
step4:選擇【灰色預測模型】;
step5:查看對應的數據數據格式,【灰色預測模型】要求輸入1個(ge) 時間序列數據定量變量。
step6:選擇向後預測的期數。
step7:點擊【開始分析】,完成全部操作。
9、決策樹
決(jue) 策樹中每個(ge) 內(nei) 部節點都是一個(ge) 分裂問題:指定了對實例的某個(ge) 屬性的測試,它將到達該節點的樣本按照某個(ge) 特定的屬性進行分割,並且該節點的每一個(ge) 後繼分支對應於(yu) 該屬性的一個(ge) 可能值。分類決(jue) 策樹葉節點所含樣本中,其輸出變量的眾(zhong) 數就是分類結果。
輸入輸出描述 輸入:自變量 X 為(wei) 1 個(ge) 或 1 個(ge) 以上的定類或定量變量,因變量 Y 為(wei) 一個(ge) 定類變量。
輸出:模型輸出的決(jue) 策樹結構圖及模型的分類效果。
案例:根據紅酒的顏色強度,苯酚,類黃酮等變量,生成一個(ge) 能夠區分琴酒,雪莉,貝爾摩德三種品種的紅酒的決(jue) 策樹。
案例操作
10、xgboost
xgboost是GBDT的一種高效實現,和GBDT不同,xgboost給損失函數增加了正則化項;且由於(yu) 有些損失函數是難以計算導數的,xgboost使用損失函數的二階泰勒展開作為(wei) 損失函數的擬合。
輸入輸出描述 輸入:自變量X為(wei) 1個(ge) 或1個(ge) 以上的定類或定量變量,因變量Y為(wei) 一個(ge) 定類變量。
輸出:模型的分類結果和模型分類的評價(jia) 效果。
案例:根據紅酒的顏色強度,脯氨酸,類黃酮等變量,生成一個(ge) 能夠區分琴酒,雪莉,貝爾摩德三種品種的紅酒的xgboost。
案例操作
step4:選擇【xgboost分類】;
step5:查看對應的數據數據格式,按要求輸入【xgboost分類】數據;
step6:進行參數設置(“更多設置”裏的參數在客戶端可進行設定)
step7:點擊【開始分析】,完成全部操作。
評論已經被關(guan) 閉。