国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

讓代碼飛起來——高性能Julia學(xué)習(xí)筆記(三)

edgardeng / 1433人閱讀

摘要:前面兩篇讓代碼飛起來高性能學(xué)習(xí)筆記一讓代碼飛起來高性能學(xué)習(xí)筆記二,介紹了如何寫出高性能的代碼,這篇結(jié)合我最近的項(xiàng)目,簡單測試對比一下各種語言用算法計(jì)算的效率。下一篇,我們就來看一下中如何利用并行進(jìn)一步提高效率。

前面兩篇讓代碼飛起來——高性能 Julia 學(xué)習(xí)筆記(一) 讓代碼飛起來——高性能 Julia 學(xué)習(xí)筆記(二), 介紹了如何寫出高性能的 Julia 代碼, 這篇結(jié)合我最近的項(xiàng)目, 簡單測試對比一下各種語言用 monte carlo 算法計(jì)算 pi 的效率。

首先聲明一下, 本文不能算嚴(yán)格意義上的性能測試, 也不想挑起語言圣戰(zhàn), 個(gè)人能力有限, 實(shí)現(xiàn)的不同語言版本代碼也未必是最高效的, 基本都是 naive 實(shí)現(xiàn)。

如果對 Monte Carlo 算法不熟悉, 可以參考下面兩個(gè)資料, 我就不浪費(fèi)時(shí)間重復(fù)了:

https://zh.wikipedia.org/wiki...

http://www.ruanyifeng.com/blo...

機(jī)器是 2015 年的 MacPro:

Processor: 2.5GHz Intel Core i7
Memory: 16GB 1600 MHZ DDR3
Os: macOS High Sierra Version 10.13.4
JS 版本
function pi(n) {
  let inCircle = 0;
  for (let i = 0; i <= n; i++) {
    x = Math.random();
    y = Math.random();
    if (x * x + y * y < 1.0) {
      inCircle += 1;
    }
  }
  return (4.0 * inCircle) / n;
}
const N = 100000000;
console.log(pi(N));

結(jié)果:

?  me.magicly.performance git:(master) ? node --version
v10.11.0
?  me.magicly.performance git:(master) ? time node mc.js
3.14174988
node mc.js  10.92s user 0.99s system 167% cpu 7.091 total
Go 版本
package main

import (
    "math/rand"
)

func PI(samples int) (result float64) {
    inCircle := 0
    r := rand.New(rand.NewSource(42))

    for i := 0; i < samples; i++ {
        x := r.Float64()
        y := r.Float64()
        if (x*x + y*y) < 1 {
            inCircle++
        }
    }

    return float64(inCircle) / float64(samples) * 4.0
}

func main() {
    samples := 100000000
    PI(samples)
}

結(jié)果:

?  me.magicly.performance git:(master) ? go version
go version go1.11 darwin/amd64
?  me.magicly.performance git:(master) ? time go run monte_carlo.go
go run monte_carlo.go  2.17s user 0.10s system 101% cpu 2.231 total
C 版本
#include 
#include 
#include 
#include 
#define SEED 42

int main(int argc, char **argv)
{
  int niter = 100000000;
  double x, y;
  int i, count = 0;
  double z;
  double pi;

  srand(SEED);
  count = 0;
  for (i = 0; i < niter; i++)
  {
    x = (double)rand() / RAND_MAX;
    y = (double)rand() / RAND_MAX;
    z = x * x + y * y;
    if (z <= 1)
      count++;
  }
  pi = (double)count / niter * 4;
  printf("# of trials= %d , estimate of pi is %g 
", niter, pi);
}

結(jié)果:

?  me.magicly.performance git:(master) ? gcc --version
Configured with: --prefix=/Applications/Xcode.app/Contents/Developer/usr --with-gxx-include-dir=/usr/include/c++/4.2.1
Apple LLVM version 9.1.0 (clang-902.0.39.2)
Target: x86_64-apple-darwin17.5.0
Thread model: posix
InstalledDir: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin
?  me.magicly.performance git:(master) ? gcc -O2 -o mc-pi-c mc-pi.c
?  me.magicly.performance git:(master) ? time ./mc-pi-c
# of trials= 100000000 , estimate of pi is 3.14155
./mc-pi-c  1.22s user 0.00s system 99% cpu 1.226 total
C++ 版本
#include 
#include  //defines rand(), srand(), RAND_MAX
#include    //defines math functions

using namespace std;

int main()
{
  const int SEED = 42;
  int interval, i;
  double x, y, z, pi;
  int inCircle = 0;

  srand(SEED);

  const int N = 100000000;
  for (i = 0; i < N; i++)
  {
    x = (double)rand() / RAND_MAX;
    y = (double)rand() / RAND_MAX;

    z = x * x + y * y;
    if (z < 1)
    {
      inCircle++;
    }
  }
  pi = double(4 * inCircle) / N;

  cout << "
Final Estimation of Pi = " << pi << endl;
  return 0;
}

結(jié)果:

?  me.magicly.performance git:(master) ? c++ --version
Apple LLVM version 9.1.0 (clang-902.0.39.2)
Target: x86_64-apple-darwin17.5.0
Thread model: posix
InstalledDir: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin
?  me.magicly.performance git:(master) ? c++ -O2 -o mc-pi-cpp mc-pi.cpp
?  me.magicly.performance git:(master) ? time ./mc-pi-cpp

Final Estimation of Pi = 3.14155
./mc-pi-cpp  1.23s user 0.01s system 99% cpu 1.239 total
Julia 版本
function pi(N::Int)
  inCircle = 0
  for i = 1:N
      x = rand() * 2 - 1
      y = rand() * 2 - 1

      r2 = x*x + y*y
      if r2 < 1.0
          inCircle += 1
      end
  end

  return inCircle / N * 4.0
end

N = 100_000_000
println(pi(N))

結(jié)果:

?  me.magicly.performance git:(master) ? julia
               _
   _       _ _(_)_     |  Documentation: https://docs.julialang.org
  (_)     | (_) (_)    |
   _ _   _| |_  __ _   |  Type "?" for help, "]?" for Pkg help.
  | | | | | | |/ _` |  |
  | | |_| | | | (_| |  |  Version 1.0.1 (2018-09-29)
 _/ |\__"_|_|_|\__"_|  |  Official https://julialang.org/ release
|__/                   |

julia> versioninfo()
Julia Version 1.0.1
Commit 0d713926f8 (2018-09-29 19:05 UTC)
Platform Info:
  OS: macOS (x86_64-apple-darwin14.5.0)
  CPU: Intel(R) Core(TM) i7-4870HQ CPU @ 2.50GHz
  WORD_SIZE: 64
  LIBM: libopenlibm
  LLVM: libLLVM-6.0.0 (ORCJIT, haswell)

?  me.magicly.performance git:(master) ? time julia mc.jl
3.14179496
julia mc.jl  0.85s user 0.17s system 144% cpu 0.705 total

另外 Rust 開發(fā)環(huán)境升級搞出了點(diǎn)問題, 沒弄好, 不過根據(jù)之前的經(jīng)驗(yàn), 我估計(jì)跟 C++差不多。

github 上找到一份對比, 包含了更多的語言, 有興趣的可以參考一下https://gist.github.com/jmoir... , LuaJIT 居然跟 Rust 差不多一樣快, 跟 Julia 官網(wǎng)的 benchmark 比較一致https://julialang.org/benchma... 。

另外實(shí)現(xiàn)了兩個(gè) Go 的并發(fā)版本:

package main

import (
    "fmt"
    "math/rand"
    "runtime"
    "time"
)

type Job struct {
    n int
}

var threads = runtime.NumCPU()
var rands = make([]*rand.Rand, 0, threads)

func init() {
    fmt.Printf("cpus: %d
", threads)
    runtime.GOMAXPROCS(threads)

    for i := 0; i < threads; i++ {
        rands = append(rands, rand.New(rand.NewSource(time.Now().UnixNano())))
    }
}

func MultiPI2(samples int) float64 {
    t1 := time.Now()

    threadSamples := samples / threads

    jobs := make(chan Job, 100)
    results := make(chan int, 100)

    for w := 0; w < threads; w++ {
        go worker2(w, jobs, results, threadSamples)
    }

    go func() {
        for i := 0; i < threads; i++ {
            jobs <- Job{
                n: i,
            }
        }
        close(jobs)
    }()

    var total int
    for i := 0; i < threads; i++ {
        total += <-results
    }

    result := float64(total) / float64(samples) * 4
    fmt.Printf("MultiPI2: %d times, value: %f, cost: %s
", samples, result, time.Since(t1))
    return result
}
func worker2(id int, jobs <-chan Job, results chan<- int, threadSamples int) {
    for range jobs {
        // fmt.Printf("worker id: %d, job: %v, remain jobs: %d
", id, job, len(jobs))
        var inside int
        // r := rand.New(rand.NewSource(time.Now().UnixNano()))
        r := rands[id]
        for i := 0; i < threadSamples; i++ {
            x, y := r.Float64(), r.Float64()

            if x*x+y*y <= 1 {
                inside++
            }
        }
        results <- inside
    }
}

func MultiPI(samples int) float64 {
    t1 := time.Now()

    threadSamples := samples / threads
    results := make(chan int, threads)

    for j := 0; j < threads; j++ {
        go func() {
            var inside int
            r := rand.New(rand.NewSource(time.Now().UnixNano()))
            for i := 0; i < threadSamples; i++ {
                x, y := r.Float64(), r.Float64()

                if x*x+y*y <= 1 {
                    inside++
                }
            }
            results <- inside
        }()
    }

    var total int
    for i := 0; i < threads; i++ {
        total += <-results
    }

    result := float64(total) / float64(samples) * 4
    fmt.Printf("MultiPI: %d times, value: %f, cost: %s
", samples, result, time.Since(t1))
    return result
}

func PI(samples int) (result float64) {
    t1 := time.Now()
    var inside int = 0
    r := rand.New(rand.NewSource(time.Now().UnixNano()))

    for i := 0; i < samples; i++ {
        x := r.Float64()
        y := r.Float64()
        if (x*x + y*y) < 1 {
            inside++
        }
    }

    ratio := float64(inside) / float64(samples)

    result = ratio * 4

    fmt.Printf("PI: %d times, value: %f, cost: %s
", samples, result, time.Since(t1))

    return
}

func main() {
    samples := 100000000
    PI(samples)
    MultiPI(samples)
    MultiPI2(samples)
}

結(jié)果:

?  me.magicly.performance git:(master) ? time go run monte_carlo.1.go
cpus: 8
PI: 100000000 times, value: 3.141778, cost: 2.098006252s
MultiPI: 100000000 times, value: 3.141721, cost: 513.008435ms
MultiPI2: 100000000 times, value: 3.141272, cost: 485.336029ms
go run monte_carlo.1.go  9.41s user 0.18s system 285% cpu 3.357 total

可以看出, 效率提升了 4 倍。 為什么明明有8 個(gè) CPU, 只提升了 4 倍呢? 其實(shí)我的 macpro 就是 4 核的, 8 是超線程出來的虛擬核,在 cpu 密集計(jì)算上并不能額外提升效率。 可以參考這篇文章: 物理 CPU、CPU 核數(shù)、邏輯 CPU、超線程 。

下一篇,我們就來看一下 Julia 中如何利用并行進(jìn)一步提高效率。

歡迎加入知識星球一起分享討論有趣的技術(shù)話題。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/19881.html

相關(guān)文章

  • 代碼飛起——性能Julia學(xué)習(xí)筆記(二)

    摘要:首發(fā)于接上一篇讓代碼飛起來高性能學(xué)習(xí)筆記一,繼續(xù)整理高性能學(xué)習(xí)筆記。和都只能表示特定的整數(shù)范圍,超過范圍會(huì)。通用代碼一般會(huì)用,這就有可能導(dǎo)致性能問題。 首發(fā)于 https://magicly.me/hpc-julia-2/ 接上一篇:讓代碼飛起來——高性能 Julia 學(xué)習(xí)筆記(一), 繼續(xù)整理高性能 Julia 學(xué)習(xí)筆記。 數(shù)字 Julia 中 Number 的 size 就跟 C ...

    noONE 評論0 收藏0
  • 一個(gè)神器,寫東西快得飛起

    摘要:精準(zhǔn)截圖不再需要細(xì)調(diào)截圖框這一細(xì)節(jié)功能真心值無數(shù)個(gè)贊相比大多數(shù)截屏軟件只能檢測整個(gè)應(yīng)用窗口邊界,對界面元素的判定讓你操作時(shí)可以更加精準(zhǔn)快捷,下面的動(dòng)圖就可以讓你直觀地感受到這個(gè)功能的強(qiáng)大之處。接著打開截屏的現(xiàn)象,將里面的顯示邊框?qū)挾日{(diào)整為。 ...

    Dionysus_go 評論0 收藏0
  • Julia和Java性能比較

    摘要:介紹性能號稱可以趕得上,我很好奇的執(zhí)行速度,因?yàn)槲乙恢庇玫氖牵跃拖氚押妥鲆幌潞唵蔚谋容^。總結(jié)從上面的比較來看,確實(shí)比快很多,不過這里只做了簡單的比較,并沒有做嚴(yán)謹(jǐn)?shù)臏y試,僅供參考。 1、介紹 Julia性能號稱可以趕得上c/c++,我很好奇Julia的執(zhí)行速度,因?yàn)槲乙恢庇玫氖荍ava,所以就想把Julia和Java做一下簡單的比較。這次比較一下Julia和Java做一億次加法運(yùn)算...

    chengjianhua 評論0 收藏0
  • 小型的編程項(xiàng)目有哪些值得推薦?這本神書寫了 22 個(gè),個(gè)個(gè)了不得

    摘要:電子表格使用語言電子表格是辦公軟件的必備,我們最熟知的是微軟的。文中用框架來實(shí)現(xiàn)一個(gè)簡單的電子表格,所用代碼僅行。 showImg(https://segmentfault.com/img/remote/1460000019770011); 本文原創(chuàng)并首發(fā)于公眾號【Python貓】,未經(jīng)授權(quán),請勿轉(zhuǎn)載。 原文地址:https://mp.weixin.qq.com/s/Ob... 今天,...

    haitiancoder 評論0 收藏0

發(fā)表評論

0條評論

最新活動(dòng)
閱讀需要支付1元查看
<