Vita Elyysiä 我是薇塔.阿露西安~ 昨天哇,是難得的休假日,人家從櫃子裡拿出美味的阿露西安墨魚麵包,正要享用呢,結果、結果呀,樂之看人家閒閒的,越看越不順眼,就、就過來捏我耳朵!把我捏到一大堆數字和資料堆裡,要我幫忙整理!嗚,太可惡了,我好不容易能夠放鬆耶!但......一想到他又要用搔癢來威脅人家,我就、我就......唔嗯...... |
前 言 Introduction |
||
奧義──耕書之萬象華稜!! ── 華稜卿 |
樂之曾說:
『上一次,我進行統計的時候,我遺忘了幻想國度的統計將近一整年。』
我跑去翻翻,看看那是什麼時候講的,結果發現居然是這樣↓↓↓
懶鬼,健忘呆瓜,ㄌㄩㄝ~
好啦不鬧了。這次是RPG公會星逝魔眼主線企劃的統計哟,這個原本要成為四期可是因為不是會長開的所以不能叫四期的主線大企劃,共計有80位玩家報名了109位角色,持續周期長達238天,在這段期間內,發生好多~好多~好多的故事,當然更重要的是也有好多~好多~好多的人物登場,觀眾歡呼的聲音此起彼落,綿延不絕喔。怎能夠不紀錄呢?
對,公會有海角一沙鷗(jason21716)的存串系統~也對,還有伊祁青歲(caren0609)的會計表格,都是熱心的玩家們自主維護的好東西,錄下幻想國度的每一點每一滴。
所以,現在輪到樂之(hugolin2)啦~!在從2019/11/24到2020/7/28的時間內,共2656個公會串中掃出來主線關聯串共491串(還要另外加上58個公告、通知、預告串哟),每一串看到完,紀錄男生、女生和不知道怎麼生的出場次數,以及那每一天的人氣和開串數量,交叉比對,分析歸納,終於做好這大份報告!!
哦哦,這樣看來,樂之沒想像中的那麼懶嘛~
總而言之,歡迎你來到這裡哟。我們趕快開始吧~!
採集規則 Rule of Source |
||
啊啊~紅燈區,我會想念你的~ ── 萊莉 |
老師說,做統計時,資料採樣的規則非常重要,一開始就要做好!它事關你蒐集數據的方向還有方式,連帶著決定了你能夠有效做什麼樣的分析法哟。如果資料蒐集到一半才發現有更好玩的資料漏掉了(例如玩家參加劇本的中籤率),這時要回去重新紀錄,可是非常累人的。快五百串呢!
以下是本次統計遵循的採樣規則:
時間變化圖 Time-History Graph |
||
簡單暴力,我喜歡。 ── 藍斯 |
所謂的時間變化,指的是時間演進所呈現變化的變數(variable),放在公會裡就像是每日人氣哦。紀錄這些變數的圖表就叫時間變化圖。先來看看下列本次統計的基本情況吧~
日均人氣 | 日均串數 | 角色增加總數 | 平均角色增加數 |
2920.84 | 10.98 串 | 18 名 | 0.08 名 |
時間變化圖名詞註釋
人氣 | 這個數值每天上午十點系統自動更新~ |
|
串數 | 當日開啟的串數總和,包含任何一切類型的串,如一般、劇情、劇本、後方、南方、公告串。 |
|
角色增加數 | 每天統計時,紀錄玩家們發布在公會上的新角色卡數量。 |
|
趨勢圖 | 分析兩項統計標的彼此之間關聯性所用的統計圖。 |
缺乏變化?大學生這種生物很奇妙,他們總是傾向對作業報告裡的數字動手腳,讓它看起來唬人,名名就沒有變化,還是可以把結論寫得驚天地泣鬼神似的。哼嘿,真是不把助教放在眼裡呢,還是說如果就按照平庸的數字去跑結論,就變不出什麼花招了呢?藍色線是公會在主線期間的人氣變化哦,其實擺盪得很激烈呢,介於2000和4000之間,只是太分散了,很難歸納出決定性的影響因素,就連開串數也是。所以它們的趨勢線也都很無聊,接近水平(無趨勢)呢。
人口停滯比起人類,我們賽那法西(天空精靈)生育率好低喔,峽谷去年一整年時間才出生18個新成員呢,就跟主線期間新移民到阿斯嘉特的勇者數量一模一樣。上圖中橘色資料點為每一天統計時的角色數量喔,對應左邊垂直軸;綠色資料則為當天增加的角色數量,對應右邊垂直軸。作為對照,讓你們看看上一次統計的人口增長盛況~~
人氣串數趨勢回歸分析
在開始之前,先做個深呼吸~!下面真的只是很簡單的大學程度統計學技巧哦,相信很多人跟樂之一樣在畢業後就把它還給教授了,不要緊,這是世間常......呀,這些名詞好繞口!跑去拉拉樂之衣袖,請他親自來解釋好了:『回歸分析(Regression Analysis)是一種統計測驗模型。它透過特定的資料分類和計算方式,決定出資料的y值和x值之間是否相關,以及其關聯的方向性。其中x值(變數)可以有一個或更多。當兩者的關聯性越高,輸入的x值就越能預測y值的趨勢。在測驗之前,一般都需要先建立假設(Hypothesis, H1)和虛無假設(Null Hypothesis, H0)。前者是研究者資料x值和y值有所關聯的期望,後者則是無所關聯。經過回歸分析的計算會得到一個F值,該F值將用於比對回歸分析中跟據自由度(Degree of Freedom, df)所只定的標準F值,若前者大於後者,則假設為真,反之則虛無假設為真。計算回歸分析各資料值時,會得到R平方值。R平方值是xy回歸線(Regression Line)和實際資料點之間的準確度,它用於表示資料的x值和y值的關聯性(而F值就是用於測試R平方的工具)。R平方值越大,越多資料點越接近回歸線,則xy值間的關聯性越高,反之則越低。研究者必須先測試假設成立與否,倘若假設成立,才能進一步辨識趨勢的方向(即xy呈正比或反比)和程度(關聯性的量),這兩者由線性趨勢線公式(y = ax + b)之中的a值(斜率)決定。』樂之說,要來進行兩者的回歸分析囉。你準備好了嗎~?
H1:串數能反映人氣 | H0:串數不能反映人氣 | ||
n | 238 | df reg | 1 |
alpha | 0.05 | df res | 236 |
R^2 | 0.0552 | MS reg | 2420579.8 |
SSy | 43851083.93 | MS res | 175553 |
SS reg | 242058.8 | F | 13.79 |
SS res | 41430504.1 | F critical | 3.84 |
|結論|
|
歷史資料圖 Long-Term Trends |
||
去吧,史前鯊魚飛彈! ── 銀曦侯 |
耶!非官方統計的兩大重點(時間變化和性別比例)都已經報告完成啦,好棒哦!那麼接下來奉上一些歷史性的統計資料。以下不做任何分析(回歸分析或C2TGF那些的),單純看結論,嘿嘿~
從另一角度看待人氣與串數的關係雖然人氣串數比率聽起來很費解,但其實就是人氣/串數所得的商,單位為人氣/串。每一天均會產生一個人氣值和串數值,前者除以後者,就是當天的比率。每一次統計皆是上百天,這些天的比率會產生一個平均值,就是上圖中的值喔。截至目前為止,所有比率的總平均值為2.3098人氣/串,標準差為0.482375人氣/串。上一回樂之預測若第17次非官方統計時所產生的平均比率與總平均值的差大於0.365088,則我們可以推斷,從今天起一直到進行第16次統計那天截止,RPG公會的人氣&串行為表現與以前足夠不同哟。結果符合推測。Q.E.D.!
驗證法則
R平方是任何關聯性統計值(correlation)的關聯性參考依據哦。R平方越高,代表兩筆資料之間越相關,反之亦然。R平方值在第4、5、6次統計時達到頂峰,超過0.5,然後7、9、11次統計則是慘不忍睹,代表那幾次統計中人氣和串數兩者之間關連性很低。本次的值為0.0552。嗯......慘不忍睹,關聯性越來越低啦!!
大統整看吧,新移民超不活躍的。在這兩百多天裡,平均每一位新入城的冒險者只活動了0.08串......唔嗯,又再度來到歷史次低!
性別比例圖 Gender Show Up |
||
今天在前線看到薇塔,接下來的戰鬥應該會很好運。 ── 曙葉對薇塔 |
性別比例~
這個名詞聽起來沒什麼大不了的。但就是為了這沒什麼大不了的數字,樂之必須要翻遍491串,這有多辛苦前面已經講到了,而且呀,也是因為如此,才會看到其他東西,才會有多采多姿的插曲排行榜喔。
以下是這491串內的統計基本資訊:
總出場人次 | 每串平均出場人次 | 標準差 |
1965 人 867 男人 1060 女人 38 別人 |
4 人/串 1.77 男人/串 2.16 女人/串 0.08 別人/串 |
3.11 人/串 1.74 男人/串 1.96 女人/串 0.27 別人/串 |
性別比例圖名詞註釋
已登記人物卡數 | 經更新組更新,已在RPG公會wiki登記角色卡的角色和NPC性別個別總數。為本調查的對照組(Control Group)。 |
|
出場性別數 | 某一性別之人物出現的累計次數加總。為本調查的實驗組(Experimental Group)。 | |
登場人次數 | 某一性別之人物出現的總人次數,與上者不同。範例: 491串中,薇塔(女)於5串中出現,則出場性別數為5(女性5次出場),登場人次數為1(1名女性角色)。 |
登場性別人物的總次數!以前樂之在做100串性別比例統計時,出場的男生女生大概都在200人次左右,跟以登記人數卡數有數量級差距。結果現在你看看,491串果然威力不凡,這數字好接近耶。不過為了排除變數,以下還是會轉換成百分比來比較喔。
性別比例出場分析
又、又來了,是統計分析!(跑去拉拉樂之的衣袖請他幫忙解釋)『性別比例缺乏平均、標準差等參數統計值(parametric value)的資料,我們今天的問題是......男人和女人和別人哪一種比較有愛,跟上次和每一次都一樣,呵呵......這種類別是(categorical values)的資料。於是在此採用卡方獨立性測試(Chi-Square Test of Goodness of Fit),簡稱C2TGF。C2TGF檢測代表資料的觀測次數(observed frequency, O)是否遵循期望次數(expected frequency, E)的比例分布;套用在這裡,意思就是100串結果的實驗組是否符合公會已登記的對照組。與任何統計測驗一樣,在開始之前,必須建立假設(Hypothesis)和虛無假設(Null Hypothesis)。假設的建立可以從你看到資料後對它的臆測的基礎上,也就是說你可以直覺的假設某種現象,並用統計方法去間接證實或是反證它。』好啦好啦,接下來的表格你看不懂的話沒關係噢~
假設(H1):實驗組和對照組有差異。
虛無假設(H0):實驗組和對照組無差異。
男性(A) | 女性(B) | 其他性別(C) | |
實驗組(O) 出場百分比 |
44.12 | 53.94 | 1.93 |
對照組(E) 登記百分比 |
53.60 | 41.93 | 4.47 |
r & c | 3, 2 | N | 100 |
df | 2 | alpha | 0.05 |
(AO - AE)^2 / AE | 1.676686567 | (CO - CE)^2 / CE | 1.4433 |
(BO - BE)^2 / BE | 3.44 | ||
X2 | 6.56 | P | 5.99 |
|結論|
|
性別比例出場分析(第16次比第15次)
還能再做一次卡方測試,不過這次把對照組從已登記性別比例,換成第上一次統計時的100串登場比例,比較本次和上一次性別比例的異同。
假設(H1):實驗組和對照組有差異。
虛無假設(H0):實驗組和對照組無差異。
男性(A) 女性(B) 其他性別(C) 實驗組(O)
本次出場百分比44.12 53.94 1.93 對照組(E)
上次出場百分比53.19 42.65 4.17 r & c 3, 2 N 100 df 2 alpha 0.05 (AO - AE)^2 / AE 1.546623425 (CO - CE)^2 / CE 1.2033 (BO - BE)^2 / BE 2.9886 X2 5.74 P 5.99 |結論|
- X2 < P,fail to reject H0
- 假設(H1)為真,實驗組和對照組無差異。
- 咿、咿呀?!是擦邊球,明明看起來就跟上一個測試一樣,結果只差一點點就過了!這個測試好像不太準,唔嗯......
|延伸結論|
- 女生明明就出場很多次呀,為什麼相較起上次來沒差異呢?太詭異了!
性別比例的歷史資料
哎呀,男生又開始不行了,曙葉子你看,自從第15次統計的海嘯高峰後,藍色區塊就馬上下滑,跟滑雪一樣,太明顯了。而且連其他性別也不行,被擠到天花板去快看不見了。耶嘿嘿,現在果然是我們女生的天下~!!
開串性質圖 Thread Categories |
||
你協助我寫的話,報酬用我的身體也可以喔? ── 芙芮對曙葉 |
開串性質圖!這是本次統計新的採樣歸類哦,過去從來沒有過的。以前樂之的確是有在100串蒐集期間去紀錄開了多少次劇本串、劇情串之類的啦,但那都被放到插曲去了。要知道,星逝魔眼可是主線企劃,各種類型的串分得很嚴謹,數量都很大。這些串的比例更是直接跟某角色或某NPC出場率掛勾,怎麼能夠不認真記錄一下呢?
老樣子,先來看看基本情況,然後接著定義各種性質的串吧:
主線總開串數 | 日均主線串數 |
491 串 | 2.06 串 |
串性質的定義
官方互動類 | 官方編劇組人員開啟的隨意串、反應串和玩家透過遊戲幣指定預約NPC的互動串。 | |
劇情類 | 主線劇情串,包含在同串內開放玩家角色自由互動的那種串。 | |
官方劇本類 | 官方劇本、跑團、支線的本/分串。 | |
玩家互動類 | 玩家自行開啟的預約串和互動串。 | |
玩家劇本類 | 玩家自行開啟的指定任務劇本和一般劇本的本/分串。 |
主線群眾畫像
耶,我又來了,好開心!哈哈~你喜歡薇塔嗎?你知道在所有的出場女生次數中,人家占了0.03%嗎?而又在所有的玩家互動串中,人家有14.51%的機率出沒嗎?嘿嘿~
主線劇本群眾畫像
你認識亞茵嗎?她是尊貴的銀曦卿哦。銀曦卿女士這次在星逝魔眼主線相關劇本中,佔據20.36%的出場率喔,也就是說,每五場劇本就有一次是亞茵參加的~☆
>>再來是一連串細及主線週期每一天的紀錄圖表喔!高能注意!<<
這是你的舞台
一切的演繹,你們行動的軌跡,全都在這裡。你在哪一天做了哪一件事,還記得嗎?
>>然後接下來是編劇組成員的精采數字演出喔,超高能注意!<<
動物園主線呀哈哈哈哈~~
交響樂
這次主線的編劇組成員數量是RPG公會有史以來最少的一次,所以每個人負責的串數就非常之多--或者說,黑龍和樞仔負責的串數非常之多,他們兩人開的串加在一起幾乎是月月的十倍!!!可以看到在主線前期,主要是樞仔撐場面,到了中後期棒子就交給黑龍囉。
好啦,這次統計分析報告到這邊就沒了!
什麼!?精采的插曲呢?排行呢?
還有至少那些統計原始資料呢?
薇塔妳怎麼可以這麼敷衍!!