Time of Update: 2018-07-31
譜聚類介紹: 這篇部落格對於譜聚類的介紹包括公式推導挺到位的,當時上課的ppt也是截這個圖,所以能看懂的話挺不錯的。http://www.cnblogs.com/FengYan/archive/2012/06/21/2553999.html 演算法python實現: 對於公式的推導什麼的個人的理解並不是很深,下面直接說說這個演算法的實現吧:
Time of Update: 2018-07-31
1、概述 datetime模組主要是用來表示日期的,就是我們常說的年月日時分秒,calendar模組主要是用來表示年月日,是星期幾之類的資訊,time模組主要側重點在時分秒,粗略從功能來看,我們可以認為三者是一個互補的關係,各自專註一塊。方便使用者依據不同的使用目的選用趁手的模組。 2、從time模組說起 為了學習time模組,我們需要Crowdsourced Security Testing道幾個與時間相關的概念: 1) epoch 假設我們要將時間表示成毫秒數,
Time of Update: 2018-07-31
tensorflow在python環境下,最便捷的辦法就是使用Anaconda3Integration Environment安裝。 首先在Anaconda3官網下載對應python版本的Anaconda3,3.6版本或者2.7版本均可。 事先不需要安裝python 直接安裝anconda3,會自動安裝對應的python。 Anaconda安裝成功之後,我們需要修改其包管理鏡像為國內源。 cmd中分別運行這兩個命令就好了。 conda config -
Time of Update: 2018-07-31
一、前言 用Python開發的小工具有時需要編譯打包為Windows(*.exe)、Mac等作業系統下的可執行性檔案以供非程式員使用。 二、解決方案 1) Windows,建議用Pyinstaller,有必要的話還需修改*.spec檔案的data項,補充入項目依賴的設定檔。 命令:pyinstaller 程式入口py檔案
Time of Update: 2018-07-31
對象的__del__是對象在被gc消除回收的時候起作用的一個方法,它的執行一般也就意味著對象不能夠繼續引用。 示範代碼如下: class Demo: def __del__(self):
Time of Update: 2018-07-31
背景 如何表示詞語所包含的語義。 蘋果。水果。Iphone。 蘋果、梨子,這兩個詞相關嗎。 語言的表示 符號主義:Bags-of-word,維度高、過於稀疏、缺乏語義、模型簡單 分布式表示:Word Embedding,維度低、更為稠密、包含語義、訓練複雜 Word Embedding 核心思想:語義相關的詞語,具有相似的上下文環境,例如, 蘋果和梨子 所做的事情:將每個詞語訓練成,詞向量 實踐 基於gensim包和中文維基語料
Time of Update: 2018-07-31
python中,有三個庫可以解析html文本,HTMLParser,sgmllib,htmllib。他們的實現方法不通,但功能差不多。這三個庫中提供解析html的類都是基類,本身並不做具體的工作。他們在發現的元件後(如標籤、注釋、聲名等),會調用相應的函數,這些函數必須重載,因為基類中不作處理。 比如:
Time of Update: 2018-07-31
最重要的是,我們沒有專門調用__init__方法,只是在建立一個類的新執行個體的時候,把參數包 括在圓括弧內跟在類名後面,從而傳遞給__init__方法。這是這種方法的重要之處。 __init__方法類似於C++、C#和Java中的 constructor 。 就如同__init__方法一樣,還有一個特殊的方法__del__,它在對象消逝的時候被調用。對象消 逝即對象不再被使用,它所佔用的記憶體將返回給系統作它用 注意__del__方法與
Time of Update: 2018-07-31
#! /usr/bin/env python#coding=utf-8import urllib2from bs4 import BeautifulSoupimport reimport datetimeimport randompages=set()random.seed(datetime.datetime.now())#Retrieves a list of all Internal links found on a pagedef getInternalLinks(bsObj,
Time of Update: 2018-07-31
這兩天用Python寫了個小工具,想要在沒有安裝Python的機器上執行,首先想到了pyinstaller 。 pyinstaller 打包程式通常只需要一句命令即可: 1. 開啟cmd控制台,將目錄切換到pyinstaller安裝目錄,我的在D:\python\Python36\Scripts目錄下; 2. 輸入命令:pyinstaller D:\JetBrains\PyCharm\workspace\nginx管理工具\main.py -F -
Time of Update: 2018-07-31
新人開始接觸深度學習,寫這片兩個目的: 1.記錄一下自己的學習之路,也是強迫自己用寫部落格的方式,整理思維。 2.相信很多的新人小夥伴最開始無處下手,也是為了大家一起學習。 開始正題。 (一)本人最開始電腦系統為win8_x64。奈何相容性太差,python3.6
Time of Update: 2018-07-31
資料採礦技術日趨成熟和複雜,隨著互連網發展以及大批海量資料的到來,之前傳統的依靠spss、SAS等視覺化檢視實現資料採礦建模已經越來越不能滿足日常需求,依據美國對資料科學家(data scientist)的要求,想成為一名真正的資料科學家,編程實現演算法以及編程實現建模已經是必要條件;目前很多從事資料採礦工作的人,大多都是出身非電腦專業,本身對編程基礎比較低,所以找到一門快速上手而又高效的程式設計語言是至關重要的,好的工具和程式設計語言可以起到事半功倍的效果。
Time of Update: 2018-07-31
一、EM演算法 EM演算法是一種迭代演算法,用於含有隱含變數的機率模型參數的極大似然估計。設Y為觀測隨機變數的資料,Z為隱藏的隨機變數資料,Y和Z一起稱為完全資料。 觀測資料的似然函數為: 模型參數θ的極大似然估計為: 這個問題只有通過迭代求解,下面給出EM演算法的迭代求解過程: step1、選擇合適的參數初值θ(0),開始迭代 step2、E步,求期望。θ(i)為第i次迭代θ的估計值,在第i+1步,計算下面的Q函數: Q函數為logP(Y,Z|θ)
Time of Update: 2018-07-31
1. 下載 Python-nmap :http://xael.org/pages/python-nmap-en.html 2. 解壓並運行:python setup.py install 會發現安裝在了:C:\Python27\Lib\site-packages 路徑下 3. 測試出現錯誤: >>>import nmap >>>nm =
Time of Update: 2018-07-31
1.最小二乘擬合 假設有一組實驗資料(x[i], y[i]),我們知道它們之間的函數關係:y = f(x),通過這些已知資訊,需要確定函數中的一些參數項。例如,如果f是一個線型函數f(x) = k*x+b,那麼參數k和b就是我們需要確定的值。如果將這些參數用 p 表示的話,那麼我們就是要找到一組 p 值使得如下公式中的S函數最小: 這種演算法被稱之為最小二乘擬合(Least-square fitting)。 ------------------------------------------
Time of Update: 2018-07-31
說到 super, 大家可能覺得很簡單呀,不就是用來調用父類方法的嘛。如果真的這麼簡單的話也就不會有這篇文章了,且聽我細細道來。 約定 在開始之前我們來約定一下本文所使用的 Python 版本。預設用的是 Python 3,也就是說:本文所定義的類都是新式類。如果你用到是 Python 2 的話,記得繼承 object : # 預設, Python 3class A: pass# Python 2class A(object): pass
Time of Update: 2018-07-31
在使用python的時候,經常使用到pip這個工具,可以很方便的線上安裝依賴庫,當然pip還有很多參數都可以幫我們去查詢一些庫資訊,這裡就不說pip的安裝了,還是提供下思路,在安裝python的時候,下載帶有pip的安裝包就可以直接安裝pip啦,當然沒有帶pip的,也可以通過下載安裝包,手動安裝。手動安裝還是要會的,畢竟有時候下載逾時、或者安裝失敗都可以用。命令:python 庫的setup.py install 1.查看pip
Time of Update: 2018-07-31
def main (argv): try : opts,args = getopt.getopt (argv, " hg:d " , [ " help
Time of Update: 2018-07-31
1、在確定自己不會匯入多個同名函數(從不同的模組匯入)的情況下,可以使用 from math import sqrt 【from 模組 import 函數】 這樣就可以直接使用sqrt(9),而不用每次都用math.sqrt(9) 2、可以使用變數來引用函數(及Python中的大多數對象),如 >>> import math>>> foo = math.sqrt>>> int(foo(16))4
Time of Update: 2018-07-31
上次學習了用python爬取網頁上的圖片,這次來學習一下怎麼用python來擷取網頁上我們感興趣的內容。 目標:爬取簡書首頁的文章標題,連結,閱讀量,評論數,收藏數。 步驟:和上節相同,關鍵在於Regex的選取。 import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read()