❶ Python自學可以嗎
當然可以自學。Python是一門相對來說比較簡單的編程語言,自學完全ok。
2、現用現學。這是我個人的學習方法,供大家參考。我是先學一遍基礎教程,然後在量化平台開始數據分析,用到什麼不會再去補什麼,比如數據分析用到pandas,我再去學pandas。
哪怕是基礎知識,當用到時發覺忘記了回頭復習鞏固是常有之事。只有追著自己想要的東西去學,學會了才有成就感,有動力繼續下去。這好比你追求妹子,每日負責接送,送花送包包,一段時間後,妹子和你牽手了,你才有成就感,才有動力追下去。
不信你可以做一下各種py基礎教程的練習題,做起來不是那麼有趣,有點做奧賽題的感覺,很傷腦筋,你又不知道跟自己想要的有什麼關系,你很快會覺得無聊。但大家對於基礎課程要堅持,練習題可以不做,但你要保證自己至少看懂了教程的內容。
所以,學習python是不難的,關鍵還是要有目的還有恆心,三天曬網兩天打魚這樣肯定是不成的。
❷ 數據分析需要掌握些什麼知識
一、基本工具的掌握
數據分析師三板斧:Excel、sql、Python
Excel、SQL、Python是數據分析師必知必會的3個基本工具,下面我們一個個來看
Excel
對於Excel的學習,如果你的意向的崗位不是那種純excel的數據分析師崗位的話,建議不需要花費太多時間在excel上,主要要掌握vlookup、透視表和一些常用圖表,不會的函數就直接網路。
SQL
核心!sql一定要熟,完全沒有基礎的同學可以先看《sql必知必會》,了解sql的一些基本知識,增改刪查,主要看查詢的部分。看完這本書後你對sql的語法應該有了一些基本的了解,學會之後,還需要多加練習,推薦一個練習的網站,牛客網編程,強力推薦,可以自動批改sql正誤,純中文,還有題目講解
Python
相對上面兩個工具,python的學習難度會稍微大一些。python能幹很多事,對於數據分析師來說,主要應掌握基礎語法和數據科學的模塊,主要包括pandas numpy 和機器學習庫sklearn等,有同學可能會問業務型數據分析師也需要會演算法嗎?答案是雖然不是必須項,但是加分項,尤其是在從零轉型情況下,是增加自己份量的一個籌碼。
學完這個課程你對python就有基本的了解了,但和sql一樣,還是需要多練多運用才能真正融匯貫通。那麼怎麼練習python呢,在這里推薦一個可能很多人都知道的數據競賽平台,沒錯就是kaggle,相信不少人都看過泰坦尼克號生存預測這個項目,這個項目的來源就是kaggle。在kaggle上打比賽,既能讓你練習python,又能讓你有一些項目可以放到簡歷上,一舉兩得。
二、理論知識
統計學
如果不是統計學專業的同學,一般面試官心裡都有數,不會問你很難的問題,基本屬於大學統計學范疇。對於統計學基礎不怎麼好,或者已經忘干凈的同學,可以看網易公開課里可汗學院的課程惡補一下,
機器學習
機器學習相關的知識學習成本會比較高,對某些同學來說可能會有一定難度,但對於業務型數據分析師來說,一般不會要求你去推導演算法公式,能做到明白不同演算法的適用場景、優缺點、原理大概懂就基本可以了
三、數據分析思維
分析思維是數據分析師最最核心的競爭力,上面所學習的python、sql、機器學習知識等都是在工具層面,要想使用好他們,還需要分析思維的駕馭。在面試中,對分析思維的考察也是相當重要的一環。
❸ 數據分析需要掌握哪些知識
數據分析主要需要學習:認識數據、數據基礎運算:科學計算模塊Numpy—基礎操作、數據統計分析:科學計算模塊Numpy進階—統計分析、數據可視化基礎:matplotlib基礎繪圖模塊、數據可視化高階:pyecharts三方庫html動圖繪制、表格數據操作:pandas操作表格數據、pandas進階—數據清洗 、數據集成、數據規約等內容。
認識數據:數據的定義、數據的類型、數據的度量方式、數據來源、臟數據來源、為什麼做數據處理、數據處理有哪些維度。
數據基礎運算:科學計算模塊Numpy—基礎操作:簡介、矩陣的創建、矩陣的運算、矩陣的屬性、自定義數組的創建、數組的屬性、特定形式數組的創建、隨機數組的創建、數組的索引、數組的形狀變換、數組的拆分和合並、數組運算
數據統計分析:科學計算模塊Numpy進階—統計分析:numpy文件讀寫、數組去重和重復、數組排序、常用統計分析函數
數據可視化基礎:matplotlib基礎繪圖模:塊折線圖繪制、散點圖繪制、柱狀圖繪制、子圖繪制、直方圖繪制、餅圖繪制、箱線圖繪制、雷達圖繪制、三維圖繪圖、動圖的繪制
數據可視化高階:pyecharts三方庫html動圖繪制:yecharts簡介、柱狀圖繪制、餅圖繪制、折線圖繪制、組合圖繪制、流向地圖繪制、中國地圖繪制、世界地圖繪制
表格數據操作:pandas操作表格數據:Pandas簡介、DataFrame與Series的創建、DataFrame與Series屬性、DataFrame索引修改、Pandas文件讀寫、DataFrame查詢操作、DataFrame增刪改操作、Pandas統計分析、Pandas時間數據、Pandas分組聚合、Pandas透視表及交叉表
pandas進階—數據清洗 、數據集成、數據規約:認識數據處理、數據集成、數據集成-堆疊合並、數據集成-主鍵合並、數據集成-重疊合並、數據清洗--重復值處理、數據清洗--缺失值處理
❹ 基於Pandas的數據分析平台,數據連接該不該用SqlAlchemy的ORM
當然可以自己寫代碼連接到資料庫,並操作之。使用Sqlalchmy的目的主要是ROM吧。工作重心可以放在業務處理上,而不用太操心資料庫的具體操作和sql語法,特別是多表的join~Flask的文檔里,就有說怎麼直接通過Python操作資料庫的內容。
❺ pandas 可以載入sql語句嗎
各種資料庫有相應的軟體包,SQL Server有pyodbc,Oracle有cx_Oracle,MySQL有MySQLdb,各種包有相應的調用方法。 需要根據需求選擇合適的資料庫類型,然後選擇訪問資料庫的包進一步細化後續的工作。
❻ 怎麼利用pandas做數據分析
Pandas是Python下一個開源數據分析的庫,它提供的數據結構DataFrame極大的簡化了數據分析過程中一些繁瑣操作。
1. 基本使用:創建DataFrame. DataFrame是一張二維的表,大家可以把它想像成一張Excel表單或者Sql表。Excel 2007及其以後的版本的最大行數是1048576,最大列數是16384,超過這個規模的數據Excel就會彈出個框框「此文本包含多行文本,無法放置在一個工作表中」。Pandas處理上千萬的數據是易如反掌的sh事情,同時隨後我們也將看到它比SQL有更強的表達能力,可以做很多復雜的操作,要寫的code也更少。
說了一大堆它的好處,要實際感觸還得動手碼代碼。首要的任務就是創建一個DataFrame,它有幾種創建方式:
(1)列表,序列(pandas.Series), numpy.ndarray的字典
二維numpy.ndarray
別的DataFrame
結構化的記錄(structured arrays)
(2)其中,二維ndarray創建DataFrame,代碼敲得最少:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10, 4))
df
0 1 2 3
0 0.927474 0.127571 1.655908 0.570818
1 -0.425084 -0.382933 0.468073 -0.862898
2 -1.602712 -0.225793 -0.688641 1.167477
3 -1.771992 -0.692575 -0.693494 -1.063697
4 -0.456724 0.371165 1.883742 -0.344189
5 1.024734 0.647224 1.134449 0.266797
6 1.247507 0.114464 2.271932 -0.682767
7 -0.190627 -0.096997 -0.204778 -0.440155
8 -0.471289 -1.025644 -0.741181 -1.707240
9 -0.172242 0.702187 -1.138795 -0.112005
(3)通過describe方法,可以對df中的數據有個大概的了解:
df.describe()
0 1 2 3
count 10.000000 10.000000 10.000000 10.000000
mean -0.189096 -0.046133 0.394722 -0.320786
std 1.027134 0.557420 1.258019 0.837497
min -1.771992 -1.025644 -1.138795 -1.707240
25% -0.467648 -0.343648 -0.692281 -0.817865
50% -0.307856 0.008734 0.131648 -0.392172
75% 0.652545 0.310266 1.525543 0.172096
max 1.247507 0.702187 2.271932 1.167477
2. 改變cell。
3. group by。
4. 讀寫文件。
❼ 學數據分析需要具備什麼基礎,零基礎好學嗎
Excel、SQL、Python是數據分析師必知必會的3個基本工具,下面一個個來看:
對於Excel的學習,如果意向的崗位不是那種純excel的數據分析師崗位的話,建議不需要花費太多時間在excel上,主要要掌握vlookup、透視表和一些常用圖表,不會的函數就直接網路。
SQL核心!sql一定要熟,完全沒有基礎的同學可以先看《sql必知必會》,了解sql的一些基本知識,增改刪查,主要看查詢的部分。看完這本書後你對sql的語法應該有了一些基本的了解,學會之後,還需要多加練習,推薦一個練習的網站,牛客網編程,強力推薦,可以自動批改sql正誤,純中文,還有題目講解。
相對上面兩個工具,python的學習難度會稍微大一些。python能幹很多事,對於數據分析師來說,主要應掌握基礎語法和數據科學的模塊,主要包括pandas numpy 和機器學習庫sklearn等,
想要了解更多關於數據分析的問題可以到CDA認證中心咨詢一下,CDA是大數據和人工智慧時代面向國際范圍全行業的數據分析專業人才職業簡稱,具體指在互聯網、金融、咨詢、電信、零售、醫療、旅遊等行業專門從事數據的採集、清洗、處理、分析並能製作業務報告、提供決策的新型數據人才。
❽ 如何系統地學習Python 中 matplotlib,numpy,scipy,pandas
總結一下自己學習,接觸了Numpy,Pandas,Matplotlib,Scipy,Scikit-learn,也算是入門,給出自己的軌跡(略去安裝),並總結一下其他人的答案,最後有彩蛋。
Numpy:
來存儲和處理大型矩陣,比Python自身的嵌套列表(nested list structure)結構要高效的多,本身是由C語言開發。這個是很基礎的擴展,其餘的擴展都是以此為基礎。數據結構為ndarray,一般有三種方式來創建。
Python對象的轉換
通過類似工廠函數numpy內置函數生成:np.arange,np.linspace.....
從硬碟讀取,loadtxt
快速入門:Quickstart tutorial
Pandas:
基於NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。最具有統計意味的工具包,某些方面優於R軟體。數據結構有一維的Series,二維的DataFrame(類似於Excel或者SQL中的表,如果深入學習,會發現Pandas和SQL相似的地方很多,例如merge函數),三維的Panel(Pan(el) + da(ta) + s,知道名字的由來了吧)。學習Pandas你要掌握的是:
匯總和計算描述統計,處理缺失數據 ,層次化索引
清理、轉換、合並、重塑、GroupBy技術
日期和時間數據類型及工具(日期處理方便地飛起)
快速入門:10 Minutes to pandas
Matplotlib:
Python中最著名的繪圖系統,很多其他的繪圖例如seaborn(針對pandas繪圖而來)也是由其封裝而成。創世人John Hunter於2012年離世。這個繪圖系統操作起來很復雜,和R的ggplot,lattice繪圖相比顯得望而卻步,這也是為什麼我個人不丟棄R的原因,雖然調用
plt.style.use("ggplot")
繪制的圖形可以大致按照ggplot的顏色顯示,但是還是感覺很雞肋。但是matplotlib的復雜給其帶來了很強的定製性。其具有面向對象的方式及Pyplot的經典高層封裝。
需要掌握的是:
散點圖,折線圖,條形圖,直方圖,餅狀圖,箱形圖的繪制。
繪圖的三大系統:pyplot,pylab(不推薦),面向對象
坐標軸的調整,添加文字注釋,區域填充,及特殊圖形patches的使用
金融的同學注意的是:可以直接調用Yahoo財經數據繪圖(真。。。)
Pyplot快速入門:Pyplot tutorial
Scipy:
方便、易於使用、專為科學和工程設計的Python工具包.它包括統計,優化,整合,線性代數模塊,傅里葉變換,信號和圖像處理,常微分方程求解器等等。
基本可以代替Matlab,但是使用的話和數據處理的關系不大,數學系,或者工程系相對用的多一些。(略)
近期發現有個statsmodel可以補充scipy.stats,時間序列支持完美
Scikit-learn:
關注機器學習的同學可以關注一下,很火的開源機器學習工具,這個方面很多例如去年年末Google開源的TensorFlow,或者Theano,caffe(賈揚清),Keras等等,這是另外方面的問題。
主頁:An introction to machine learning with scikit-learn
圖書:
Pandas的創始者:利用Python進行數據分析 (豆瓣)(力薦)
教材的集合:Scipy Lecture Notes(寫的非常棒!遺憾缺少Pandas)
提升自己:機器學習實戰 (豆瓣)
❾ 學習經濟學需要熟悉哪些編程語言
學習經濟學需要熟悉哪些編程語言?
1)壇友arthur_2006
處理和分析數據都用得到,最基本的是excel,如果你的VBA用得好的話會有很大的幫助,如果你要分析數據的話,比如你要建模那麼SAS還是不錯的,不過比較難掌握如果你沒有語言方面的基礎,其他還有很多軟體也能做得到。很多銀行證券期貨企業都使用的是oracle或者DB2,一些小企業可能使用的是SQL, 所以如果想在這方面發展就要掌握資料庫的知識,畢竟金融和計算機兼備的人才還是稀缺的,而且國內很多行業都是用的是這幾大資料庫比如電信醫療航空等等,不會分析金融數據恐怕稱不上什麼金融專家吧,至於你分析得准還是不準那就要看你的金融知識掌握的程度啦,尤其是投資專業的學生學習一些這方面的知識是必要的,很多人是應用金融學專業的偏向於財務,那就去考考CFA,ACCA什麼的,也沒必要在這上面花費太多精力而且工作中很可能用不到的,金融數學金融工程精算專業的同學花點時間研究一下還是很有必要的,總而言之一句話,首先要看你的興趣再就是你的專業和發展方向。
2)編程愛好者任坤
做統計和計量的話,想要跟當今的國際學術界接軌,最好學R,至少我所知道的目前美國的統計學術界被R佔領的趨勢很明顯了。
如果只是做簡單地回歸隨便解讀一下,那隨便選個傻瓜軟體就可以了。如果只是應用現成的成熟的計量模型來做實證研究,那麼傻瓜軟體一般也就可以了。如果要以統計、計量為研究領域或者專業領域,那麼編程性的東西是少不了的,即使是做實證如果涉及較為復雜的數據結構,懂編程也能幫你大幅提高生產力。另外,R的社區比較活躍,能夠較好地跟上前沿。
如果涉及到處理較大的數據,一種辦法是用SAS,如果不想用SAS可以學資料庫方面的東西,比如把數據放在SQLite資料庫中然後用{RSQLite}訪問資料庫,或者用{sqldf}通過SQL操作環境中的data frame。
如果覺得執行某項任務R單核速度慢,那麼可以使用{parallel}或者{parallelMap}做並行計算,也可以利用雲計算來處理數據。
如果涉及到其他社區的東西在R社區中沒有實現,例如Java的東西,可以用{rJava}來調用Java的對象,不過速度有些慢。
比較好的辦法是我在想從事數據分析工作,學什麼軟體或語言最好? 提到的F#函數式編程語言,用RProvider可以直接調用R,用JavaProvider直接調用Jar打包的Java程序,用PythonProvider(即將發布)直接調用Python程序,等等,很容易將各大社區的資源整合在一起使用。
目前我在GitHub上面弄一個通過R學習統計、計量、非參、數據可視化、資料庫的repo: renkun-ken/learnR on GitHub ,雖然目前還沒什麼內容,不過可以跟蹤一下。
以上說得都是經濟學相關的統計和計量方面所需要的編程。事實上統計和計量所需的「編程」較為簡單,基本也就是處理數據、應用已經提供的計量模型,更多需要編程的是:一、如果涉及較為前沿的計量模型,可能還需要自己實現;二、一些蒙特卡羅模擬需要一些編程。
從經濟學相關的一些新型領域來說,計算經濟學(Computational Economics)、計算統計學(Computational Statistics)以及計算計量學(Computational Econometrics)則需要較強的編程能力,包括演算法實現、演算法分析等等。舉個例子,計算經濟學中目前做的一塊研究是Agent-based computational finance,就是建立一個模擬的金融市場,裡面有幾種資產,每種資產的基本面由隨機的紅利決定,裡面有許多遵循各種邏輯的投資者,投資者對於紅利發放持有的信念不同,因而從各自的邏輯觸發的交易行為不同。在一個復式競價(double auction)的交易市場中,什麼樣的投資者組成或者行為方式、什麼樣的記憶長短,能夠最大程度地復制出我們在現實金融市場中觀測到的資產價格或者資產收益率規律,例如資產收益率尖峰肥尾、不對稱性。此時,研究者就需要較扎實的金融知識來設計一個不過於簡單而又不過於復雜的模擬金融市場,也需要相應的編程能力把模型用程序語言編寫出來。這中間會設計許多編程技術,例如資料庫(有時要跟蹤許多變數,例如投資者現金流動、財富分布)、並行計算(CPU多核並行、多進程並行、集群上的並行甚至GPU計算)等等。這方面的研究從1990s年代才開始。
3)知乎網友Jichun Si
計量經濟學也有很多小的門類,請對號入座。有很多軟體,Stata, matlab, R, SAS是相對來說用的比較多的。
如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。現在主流期刊的應用微觀計量文章裡面能用到的模型stata幾乎都有,而且其中的絕大多數都是用stata做的。而且最大的優點是,簡單!
如果做應用的時間序列,Eviews似乎是一個不錯的選擇。但是我一般不做這方面,也不是很有發言權。
如果做理論計量,stata eviews是沒有現成的包的,而且即便Stata可以編程,可編程能力也是很差的,而且不穩健。所以懂R和Matlab就非常順手。當然也可以用Python,最近Sargent就寫了本用Python做計量的書。還有一個Julia,是這三種語言的混合,但是速度快很多,缺點是太過於小眾。
如果對速度要求高,特別是金融計量很多對速度有要求的,可以考慮C、Fortran等語言。C和Fortran肯定是最快的。還有一個叫做OX的,速度快,但是也很小眾。但是這些語言的缺點是學習難度比較高,開發時間比較慢。Julia據說速度堪比C,而且語法特別像Matlab、Python(意味著容易學習),但是處於剛起步階段,用的人太少了。
如果是金融計量領域,強烈建議學會SAS。SAS是最權威,速度也很快,當然最大的問題是昂貴,而且可編程能力不是多麼好。但是金融裡面數據量都非常非常非常大,一般的軟體都癱的時候,SAS就派上用場了。
像我自己,做應用的時候都是用stata整理數據,能用stata的堅決不用其他軟體。但是因為有的時候做一些理論計量的工作,所以matlab也是必不可少的。我也在學習Julia,因為matlab的速度實在太慢。Python我一般不用來做科學計算,用的人不多,而且速度慢,一般是用來抓數據的。
最後還是補充一點吧,為什麼我推薦matlab而不是其他的軟體,也是有道理的。很多模型,比如空間計量模型(spatial econometrics)、貝葉斯估計、以及宏觀計量裡面的DSGE model、SVAR等模型,在stata、Eviews裡面都是沒有什麼現成的東西可以用的,但是matlab提供了豐富的包,比如Dynare就是基於Matlab的,還有LeSage的空間計量軟體包等等,也是基於matlab的。所以幾乎你想用的模型matlab裡面都能找到codes然後直接用。就算沒有,你自己在matlab裡面寫,也不是什麼難事。
最後想起一句話來,關於這些軟體的選擇(stata除外,因為stata在應用計量領域的地位是幾乎不可替代的)可以用兩句話來概括:如果你自己的時間比計算機的時間寶貴的話,學習matlab、R、甚至Python、Julia是最合適的,如果計算機的時間比你的時間寶貴的話,學習C、Fortran是必須的。當然除非你的工作非常特殊(比如一些大型的結構模型的估計),一般來說,還是自己的時間更寶貴一點。
綜上,做應用和做理論是不可能用一種軟體解決的,建議根據自己的方向進行挑選。我覺著stata、matlab是比較推薦的,一個方便,一個靈活,都很強大,而且學習難度都不大,用的人都很多,交流起來相當方便。
4)網友張真實
數據,簡單的用excel,直觀,方便。復雜一些的…excel最多可以有6萬多行,你確定你需要從那麼大量的數據開始「學經濟學么?
復雜的用R,各種模型,演算法,實現,基本上R都有對應的軟體包了,下載下來直接用即可,多讀文檔多練多用,半年左右就可以拋開excel直接用R作實戰了。我博士論文全部回歸和輸出都是用R的,現在寫的論文也都用它。替代品是Stata。也很好,但如果你和我一樣是從0開始,那麼強烈建議選R。
R的一個不足是沒法作符號運算,這個免費的解決方案有python搭配scipy numpy等幾個包,不過建議你用mathematica,它的符號計算功能最強大,輸出格式也最好。你可以找個jacobian矩陣搞一下符號計算,比較一下結果就知道了。
Python這東西,熟悉了R之後,發現有功能是R實現不了的,到時候有實際需求了,再學也不遲。不是立刻就需要的。
此外,所有經濟學研究(我是指empirics類型的,具體意思你懂的),都要會用latex,可以把它看做是一門編程語言。在word里排數學公式,用不了多久你就會瘋掉。R中可以用ggplot2來繪圖,輸出到tex中。普通數據表用xtable包輸出到tex,回歸結果用stargazer輸出到tex,都很方便。
5)網友bayes
首先要說的是R,絕對是目前國外學術界的主流,統計系基本除R以外沒有其他了,計量作為和統計相關的方向,R也在逐漸滲透。所以推薦學習。
順便說一句,R的學習曲線是比較陡峭的,所以我不太建議零基礎的人從R開始,否則挫折感會比較強烈。而python會略好,所以我建議從python開始。
python並非是專用於統計或者計量的軟體,而是一種非常流行的通用編程語言。經過多年發展,庫也非常齊備。我試用過numpy,scipy和pandas等庫,與其他通用編程語言相比,算是相當好用,不過個人感覺還是比不上R,比如畫圖,
ggplot2真心是神一般的存在,python的庫還是略遜一籌。但是,除了數據處理之外,python可以乾的事情太多了,也太牛了。我們主要要用到的,比如網頁採集數據,需要正則表達式,解析網頁等等。這些方面python就比R有優勢多了。
當然,從趨勢來看,未來似乎python比R更優。R是一群統計學家在編程序,python是一群計算機專家在爭取搞數據處理。似乎python的基礎更扎實。個人觀點,僅供參考。
stata我認為是除了R以外最好的計量軟體了,我兩者均用過數年數個項目,但是依然感覺R更好用,整理和處理數據更方便。所以即使在樓上諸位所提到的微觀計量領域,我依然更喜歡R。
除此以外spss,或者eviews等,感覺管理類學生用的更多,功能比較受限,不太推薦。這里不贅述。上述的幾個軟體,還有個問題,在於都是收費的,考慮到未來知識產權的保護,還是用免費的略靠譜。
R的主要缺點有兩個:
1,面對大數據乏力。這方面sas確實有優勢,但是不得不說,sas的語法太反人類了,完全接受不能。面對這個問題,我要說的是,你得看問題有多大。以我的經驗,經濟裡面的數據量似乎還不足以超過R的處理上限很多。可能金融的高頻數據會比較大,我個人沒啥經驗,如果遇到再補充。我嘗試過10g的數據,最簡單的辦法,不是學sas,而是買16g的內存。:)以現在的內存價格,我覺得32g以下的問題不大。
2,性能不足。這方面python也有同樣的問題,最好的解決方案是混合c/c++,不過這個就是無底洞了,耗時極多,都不見得能學好。建議的方法,還是買硬體,這個最簡單。:)當然用並行包等,也是解決方法之一,我嘗試過幾次用機房的多台機器做集群,不是太成功。求高人指點。
上面諸位還提到過幾個軟體,我也略微說一下自己知道的一些軟體的看法:
matlab:好東西,關鍵還是性能問題,同樣可以靠c/c++來解決。但是我不喜歡比較大的軟體,為了求個均值方差,等它啟動就佔了5分鍾。。。
julia:好東西X2,目前關注中,可能還比較年輕,導致配套的庫略少,不過看好未來發展,主要是吸取了matlab,python和c/c++的有點,寫的快,運算的也快,未來看漲,緊密關注。
最後提一下函數式編程,是個好東西,但是不看好純粹函數式編程的未來。它體現了一種頗先進的編程思想,但是在實際工作中,往往性能方面的問題較大。要解決這個問題,還是的混合函數式編程和其他方式,但這就是python,R等軟體已經實現的方式,似乎又沒有必要專門去學其他的函數式編程了。
6)上海財經大學博士 榮健欣
Stata微觀計量中應用極多,主要是直接輸命令回歸,需要編程的地方不多。
至於編程,推薦R、Python.
R是非常好的統計分析軟體,在計量經濟學中的應用可以見Econometrics in R, Applied Econometrics with R Time Series Analysis with Applications in R這幾本書
Python用來抓數據很好,並且有數學計算包SciPy可以部分替代Matlab之類科學計算的功能。
7)知乎網友justin
本科經濟統計學,由於學校奇葩的課程設置,我們分別使用過:
EViews:計量經濟學,時序和多元統計。
Stata:計量經濟學。
SPSS:專門開的一門課,這個巨汗,權當復習了一遍統計學。
Excel:大一的統計入門課使用的,這個也巨坑,就是簡單的函數使用,一點沒有涉及VBA。
Matlab:這個沒有專門的課,是上完了C語言程序設計以後副產品,後來接觸了R和Mathematica就基本拋棄了它。
R/S-Plus:在回歸分析的時候使用了S-Plus,不過那時候我已經使用R語言很久了,而且S-Plus基本兼容,所以沒有使用過S-Plus。
Minitab:質量控制課程上用的,基本的統計加上一些實驗設計。
SAS:這個在實驗室中自學過幾次,直接被其奇葩的語法雷到了,據說我們學校的研究生有專門的SAS課程(類似於本科的SPSS課程),呵呵了~
我們系的妹(xue)紙(ba)就曾經抱怨說使用的軟體太多了,完全被逼瘋的感覺,還給我們親愛的系主任提過意見。作為學渣也就這個問題問過系主任,她的意思是不同的軟體在處理不同的數據時候是各有所長的,而且你們課程還是蠻輕松的,就多學點吧,另外不同的老師有不同的軟體使用愛好,上課使用不同的軟體是必然的。
學習經濟學的同學,Excel和SPSS,EViews(或者Stata)就蠻好的了,Stata和EViews都可以寫一些程序的,SPSS的界面化操作也是很友好的。本人使用的R,在上各種課中也都會在學了那些軟體後再使用R來實現(其實絕大多數時候R都已經有現成的包了,我也大多是直接使用),R還是很不錯的,推薦。
很多前輩也提出了,經濟學學生學習編程適可而止就好了,要不然就是一條不歸路啊,面臨著徹底轉行的危險,本人就是一枚反面例子(淚~。所以什麼Python啊,C++啊,Julia啊就不要接觸了。