Android ANR 分析 /data/anr/trace.txt 該檔案記錄了產生ANR的函數堆棧可以協助分析

來源:互聯網
上載者:User

標籤:執行時間   tables   acp   x11   ted   mat   perm   zygote   sys   

Log 在android中的地位非常重要,要是作為一個android程式員不能過分析log這關,算是android沒有入門吧 。 下面我們就來說說如何處理log檔案 。


什麼時候會有Log檔案的產生 ?
Log的產生大家都知道 , 大家也都知道通過DDMS來看log , 但什麼時候會產生log檔案呢 ?一般在如下幾種情況會產生log檔案 。 
1,程式異常退出 , uncaused exception
2,程式強制關閉 ,Force Closed (簡稱FC)
3,程式無響應 , Application No Response (簡稱ANR) , 順便,一般主線程超過5秒麼有處理就會ANR
4,手動產生 。


拿到一個記錄檔,要分成多段來看 。 log檔案很長,其中包含十幾個小單元資訊,但不要被嚇到 ,事實上他主要由三大塊兒組成 。

1,系統基本資料 ,包括 記憶體,CPU ,進程隊列 ,虛擬記憶體 , 記憶體回收等資訊 。
------ MEMORY INFO (/proc/meminfo) ------
------ CPU INFO (top -n 1 -d 1 -m 30 -t) ------
------ PROCRANK (procrank) ------
------ VIRTUAL MEMORY STATS (/proc/vmstat) ------
------ VMALLOC INFO (/proc/vmallocinfo) ------

格式如下:
------ MEMORY INFO (/proc/meminfo) ------
MemTotal:         347076 kB
MemFree:           56408 kB
Buffers:            7192 kB
Cached:           104064 kB
SwapCached:            0 kB
Active:           192592 kB
Inactive:          40548 kB
Active(anon):     129040 kB
Inactive(anon):     1104 kB
Active(file):      63552 kB
Inactive(file):    39444 kB
Unevictable:        7112 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:                44 kB
Writeback:             0 kB
AnonPages:        129028 kB
Mapped:            73728 kB
Shmem:              1148 kB
Slab:              13072 kB
SReclaimable:       4564 kB
SUnreclaim:         8508 kB
KernelStack:        3472 kB
PageTables:        12172 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:      173536 kB
Committed_AS:    7394524 kB
VmallocTotal:     319488 kB
VmallocUsed:       90752 kB
VmallocChunk:     181252 kB


2,時間資訊 , 也是我們主要分析的資訊 。
------ VMALLOC INFO (/proc/vmallocinfo) ------
------ EVENT INFO (/proc/vmallocinfo) ------

格式如下:
------ SYSTEM LOG (logcat -b system -v time -d *:v) ------
01-15 16:41:43.671 W/PackageManager( 2466): Unknown permission com.wsomacp.permission.PROVIDER in package com.android.mms
01-15 16:41:43.671 I/ActivityManager( 2466): Force stopping package com.android.mms uid=10092
01-15 16:41:43.675 I/UsageStats( 2466): Something wrong here, didn‘t expect com.sec.android.app.twlauncher to be paused
01-15 16:41:44.108 I/ActivityManager( 2466): Start proc com.sec.android.widgetapp.infoalarm for service com.sec.android.widgetapp.infoalarm/.engine.DataService: pid=20634 uid=10005 gids={3003, 1015, 3002}
01-15 16:41:44.175 W/ActivityManager( 2466): Activity pause timeout for HistoryRecord{48589868 com.sec.android.app.twlauncher/.Launcher}
01-15 16:41:50.864 I/KeyInputQueue( 2466): Input event
01-15 16:41:50.866 D/KeyInputQueue( 2466): screenCaptureKeyFlag setting 0
01-15 16:41:50.882 I/PowerManagerService( 2466): Ulight 0->7|0
01-15 16:41:50.882 I/PowerManagerService( 2466): Setting target 2: cur=0.0 target=70 delta=4.6666665 nominalCurrentValue=0
01-15 16:41:50.882 I/PowerManagerService( 2466): Scheduling light animator!
01-15 16:41:51.706 D/PowerManagerService( 2466): enableLightSensor true
01-15 16:41:51.929 I/KeyInputQueue( 2466): Input event
01-15 16:41:51.933 W/WindowManager( 2466): No focus window, dropping: KeyEvent{action=0 code=26 repeat=0 meta=0 scancode=26 mFlags=9}



3,虛擬機器資訊 , 包括進程的,線程的跟蹤資訊,這是用來跟蹤進程和線程具體點的好地方 。 
------ VM TRACES JUST NOW (/data/anr/traces.txt.bugreport: 2011-01-15 16:49:02) ------
------ VM TRACES AT LAST ANR (/data/anr/traces.txt: 2011-01-15 16:49:02) ------


格式如下 :
----- pid 21161 at 2011-01-15 16:49:01 -----
Cmd line: com.android.mms

DALVIK THREADS:
"main" prio=5 tid=1 NATIVE

 

| group="main" sCount=1 dsCount=0 s=N obj=0x4001d8d0 self=0xccc8  | sysTid=21161 nice=0 sched=0/0 cgrp=default handle=-1345017808  | schedstat=( 4151552996 5342265329 10995 )  at android.media.MediaPlayer._reset(Native Method)  at android.media.MediaPlayer.reset(MediaPlayer.java:1218)  at android.widget.VideoView.release(VideoView.java:499)  at android.widget.VideoView.access$2100(VideoView.java:50)  at android.widget.VideoView$6.surfaceDestroyed(VideoView.java:489)  at android.view.SurfaceView.reportSurfaceDestroyed(SurfaceView.java:572)  at android.view.SurfaceView.updateWindow(SurfaceView.java:476)  at android.view.SurfaceView.onWindowVisibilityChanged(SurfaceView.java:206)  at android.view.View.dispatchDetachedFromWindow(View.java:6082)  at android.view.ViewGroup.dispatchDetachedFromWindow(ViewGroup.java:1156)  at android.view.ViewGroup.removeAllViewsInLayout(ViewGroup.java:2296)  at android.view.ViewGroup.removeAllViews(ViewGroup.java:2254)  at com.android.mms.ui.SlideView.reset(SlideView.java:687)  at com.android.mms.ui.SlideshowPresenter.presentSlide(SlideshowPresenter.java:189)  at com.android.mms.ui.SlideshowPresenter$3.run(SlideshowPresenter.java:531)  at android.os.Handler.handleCallback(Handler.java:587)  at android.os.Handler.dispatchMessage(Handler.java:92)  at android.os.Looper.loop(Looper.java:123)  at android.app.ActivityThread.main(ActivityThread.java:4627)  at java.lang.reflect.Method.invokeNative(Native Method)  at java.lang.reflect.Method.invoke(Method.java:521)  at com.android.internal.os.ZygoteInit$MethodAndArgsCaller.run(ZygoteInit.java:858)  at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:616)  at dalvik.system.NativeStart.main(Native Method)

閑話少說, 我總結了觀察log檔案的基本步驟 。 1,如果是ANR問題 , 則搜尋“ANR”關鍵詞 。 快速定位到關鍵事件資訊 。
2,如果是ForceClosed 和其它異常退出資訊,則搜尋"Fatal" 關鍵詞, 快速定位到關鍵事件資訊 。
3,定位到關鍵事件資訊後 , 如果資訊不夠明確的,再去搜尋應用程式套件組合的虛擬機器資訊 ,查看具體的進程和線程跟蹤的日誌,來定位到代碼 。 

用這種方法,出現問題,根本不需要斷點調試 , 直接定位到問題,屢試不爽 。 
下面,我們就開始來分析這個例子的log 。

開啟log檔案 , 由於是ANR錯誤,因此搜尋"ANR " , 為何要加空格呢,你加上和去掉比較一下就知道了 。 可以屏蔽掉不少儲存到anr.log檔案的無效資訊 。 

定位到關鍵的事件資訊如下:
01-15 16:49:02.433 E/ActivityManager( 2466): ANR in com.android.mms (com.android.mms/.ui.SlideshowActivity)
01-15 16:49:02.433 E/ActivityManager( 2466): Reason: keyDispatchingTimedOut
01-15 16:49:02.433 E/ActivityManager( 2466): Load: 0.6 / 0.61 / 0.42
01-15 16:49:02.433 E/ActivityManager( 2466): CPU usage from 1337225ms to 57ms ago:
01-15 16:49:02.433 E/ActivityManager( 2466):   sensorserver_ya: 8% = 0% user + 8% kernel / faults: 40 minor
......


01-15 16:49:02.433 E/ActivityManager( 2466):  -com.android.mms: 0% = 0% user + 0% kernel
01-15 16:49:02.433 E/ActivityManager( 2466):  -flush-179:8: 0% = 0% user + 0% kernel
01-15 16:49:02.433 E/ActivityManager( 2466): TOTAL: 25% = 10% user + 14% kernel + 0% iowait + 0% irq + 0% softirq
01-15 16:49:02.436 I/        ( 2466): dumpmesg > "/data/log/dumpstate_app_anr.log"


我們用自然語言來描述一下日誌,這也算是一種能力吧 。 
01-15 16:49:02.433 E/ActivityManager( 2466): ANR in com.android.mms (com.android.mms/.ui.SlideshowActivity)
翻譯:在16:49分2秒433毫秒的時候 ActivityManager (進程號為2466) 發生了如下錯誤:com.android.mms包下面的.ui.SlideshowActivity 無響應 。

01-15 16:49:02.433 E/ActivityManager( 2466): Reason: keyDispatchingTimedOut
翻譯:原因 , keyDispatchingTimeOut - 按鍵分配逾時 

01-15 16:49:02.433 E/ActivityManager( 2466): Load: 0.6 / 0.61 / 0.42
翻譯:5分鐘,10分鐘,15分鐘內的平均負載分別為:0.6 , 0.61 , 0.42

在這裡我們大概知道問題是什麼了,結合我們之前的操作流程,我們知道問題是在點擊按鈕某時候可能處理不過來按鈕事件,導致逾時無響應 。那麼現在似乎已經可以進行工作了 。 我們知道Activity中是通過重載dispatchTouchEvent(MotionEvent ev)來處理點擊螢幕事件  。 然後我們可以順藤摸瓜,一點點分析去尋找原因 。 但這樣夠了麼 ?
其實不夠 , 至少我們不能準確的知道到底問題在哪兒 , 只是猜測 ,比如這個應用程式中,我就在順藤摸瓜的時候發現了多個IO操作的地方都在主線程中,可能引起問題,但不好判斷到底是哪個  ,所以我們目前掌握的資訊還不夠 。 

於是我們再分析虛擬機器資訊 , 搜尋“Dalvik Thread”關鍵詞,快速定位到本應用程式的虛擬機器資訊日誌,如下:
----- pid 2922 at 2011-01-13 13:51:07 -----
Cmd line: com.android.mms

DALVIK THREADS:

"main" prio=5 tid=1 NATIVE  | group="main" sCount=1 dsCount=0 s=N obj=0x4001d8d0 self=0xccc8  | sysTid=2922 nice=0 sched=0/0 cgrp=default handle=-1345017808  | schedstat=( 3497492306 15312897923 10358 )  at android.media.MediaPlayer._release(Native Method)  at android.media.MediaPlayer.release(MediaPlayer.java:1206)  at android.widget.VideoView.stopPlayback(VideoView.java:196)  at com.android.mms.ui.SlideView.stopVideo(SlideView.java:640)  at com.android.mms.ui.SlideshowPresenter.presentVideo(SlideshowPresenter.java:443)  at com.android.mms.ui.SlideshowPresenter.presentRegionMedia(SlideshowPresenter.java:219)  at com.android.mms.ui.SlideshowPresenter$4.run(SlideshowPresenter.java:516)  at android.os.Handler.handleCallback(Handler.java:587)  at android.os.Handler.dispatchMessage(Handler.java:92)  at android.os.Looper.loop(Looper.java:123)  at android.app.ActivityThread.main(ActivityThread.java:4627)  at java.lang.reflect.Method.invokeNative(Native Method)  at java.lang.reflect.Method.invoke(Method.java:521)  at com.android.internal.os.ZygoteInit$MethodAndArgsCaller.run(ZygoteInit.java:858)  at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:616)  at dalvik.system.NativeStart.main(Native Method)"Binder Thread #3" prio=5 tid=11 NATIVE  | group="main" sCount=1 dsCount=0 s=N obj=0x4837f808 self=0x242280  | sysTid=3239 nice=0 sched=0/0 cgrp=default handle=2341032  | schedstat=( 32410506 932842514 164 )  at dalvik.system.NativeStart.run(Native Method)"AsyncQueryWorker" prio=5 tid=9 WAIT  | group="main" sCount=1 dsCount=0 s=N obj=0x482f4b80 self=0x253e10  | sysTid=3236 nice=0 sched=0/0 cgrp=default handle=2432120  | schedstat=( 3225061 26561350 27 )  at java.lang.Object.wait(Native Method)  - waiting on <0x482f4da8> (a android.os.MessageQueue)  at java.lang.Object.wait(Object.java:288)  at android.os.MessageQueue.next(MessageQueue.java:146)  at android.os.Looper.loop(Looper.java:110)  at android.os.HandlerThread.run(HandlerThread.java:60)"Thread-9" prio=5 tid=8 WAIT  | group="main" sCount=1 dsCount=0 s=N obj=0x4836e2b0 self=0x25af70  | sysTid=2929 nice=0 sched=0/0 cgrp=default handle=2370896  | schedstat=( 130248 4389035 2 )  at java.lang.Object.wait(Native Method)  - waiting on <0x4836e240> (a java.util.ArrayList)  at java.lang.Object.wait(Object.java:288)  at com.android.mms.data.Contact$ContactsCache$TaskStack$1.run(Contact.java:488)  at java.lang.Thread.run(Thread.java:1096)"Binder Thread #2" prio=5 tid=7 NATIVE  | group="main" sCount=1 dsCount=0 s=N obj=0x482f8ca0 self=0x130fd0  | sysTid=2928 nice=0 sched=0/0 cgrp=default handle=1215968  | schedstat=( 40610049 1837703846 195 )  at dalvik.system.NativeStart.run(Native Method)"Binder Thread #1" prio=5 tid=6 NATIVE  | group="main" sCount=1 dsCount=0 s=N obj=0x482f4a78 self=0x128a50  | sysTid=2927 nice=0 sched=0/0 cgrp=default handle=1201352  | schedstat=( 40928066 928867585 190 )  at dalvik.system.NativeStart.run(Native Method)"Compiler" daemon prio=5 tid=5 VMWAIT  | group="system" sCount=1 dsCount=0 s=N obj=0x482f1348 self=0x118960  | sysTid=2926 nice=0 sched=0/0 cgrp=default handle=1149216  | schedstat=( 753021350 3774113668 6686 )  at dalvik.system.NativeStart.run(Native Method)"JDWP" daemon prio=5 tid=4 VMWAIT  | group="system" sCount=1 dsCount=0 s=N obj=0x482f12a0 self=0x132940  | sysTid=2925 nice=0 sched=0/0 cgrp=default handle=1255680  | schedstat=( 2827103 29553323 19 )  at dalvik.system.NativeStart.run(Native Method)"Signal Catcher" daemon prio=5 tid=3 RUNNABLE  | group="system" sCount=0 dsCount=0 s=N obj=0x482f11e8 self=0x135988  | sysTid=2924 nice=0 sched=0/0 cgrp=default handle=1173688  | schedstat=( 11793815 12456169 7 )  at dalvik.system.NativeStart.run(Native Method)"HeapWorker" daemon prio=5 tid=2 VMWAIT  | group="system" sCount=1 dsCount=0 s=N obj=0x45496028 self=0x135848  | sysTid=2923 nice=0 sched=0/0 cgrp=default handle=1222608  | schedstat=( 79049792 1520840200 95 )  at dalvik.system.NativeStart.run(Native Method)

每一段都是一個線程 ,當然我們還是看線程號為1的主線程了。通過分析發現關鍵問題是這樣:
  at com.android.mms.ui.SlideshowPresenter$3.run(SlideshowPresenter.java:531)
定位到代碼:

mHandler.post(new Runnable() {                    public void run() {                        try {                            presentRegionMedia(view, (RegionMediaModel) model, dataChanged);                        } catch (OMADRMException e) {                            Log.e(TAG, e.getMessage(), e);                            Toast.makeText(mContext,                                    mContext.getString(R.string.insufficient_drm_rights),                                    Toast.LENGTH_SHORT).show();                        } catch (IOException e){                            Log.e(TAG, e.getMessage(), e);                            Toast.makeText(mContext,                                    mContext.getString(R.string.insufficient_drm_rights),                                    Toast.LENGTH_SHORT).show();                                                }                    }

很清楚了, Handler.post 方法之後執行時間太長的問題 。 繼續看presentRegionMedia(view, (RegionMediaModel) model, dataChanged);方法 , 發現最終是調用的framework 中MediaPlayer.stop方法 。

來自:38730309

Android ANR 分析 /data/anr/trace.txt 該檔案記錄了產生ANR的函數堆棧可以協助分析

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.