Go进阶23:Go指针返回值的劣势(译)

Go进阶23:Go指针返回值的劣势(译)

作为以为年迈的C语言程序员,我很纠结,function-return-pointer是很正常的事情.但是我认为function-return-pointer是非常糟糕的行为. 通常情况下我们最好还是function-return-value. 您们将看到我能够证明在go语言中function-return-value比function-return-pointer更优. 原文地址bad_go_pointer_returns

1. 定义可变大小的结构体

我将定义一个我可以轻松改变大小的结构.结构的内容是一个数组:我可以通过改变数组的大小来改变结构的大小.

const bigStructSize = 10

type bigStruct struct {
	a [bigStructSize]int
}

2. 定义结构体function-return-value和function-return-pointer

接下来,我将创建一些goroutine来构建此结构的不同容量.一个将它作为return pointer,另一个作为return value.

 func newBigStruct() bigStruct {
	var b bigStruct
	for i := 0; i < bigStructSize; i++ {
		b.a[i] = i
	}
	return b
}

func newBigStructPtr() *bigStruct {
	var b bigStruct
	for i := 0; i < bigStructSize; i++ {
		b.a[i] = i
	}
	return &b
}

3. 编写Benckmark Test Case

我将编写几个benchmark来衡量get和use这些结构所需的时间. 我将对结构中的值进行简单的计算,因此编译器不会仅仅只优化返回值.

func BenchmarkStructReturnValue(b *testing.B) {
	b.ReportAllocs()

	t := 0
	for i := 0; i < b.N; i++ {
		v := newBigStruct()
		t += v.a[0]
	}
}

func BenchmarkStructReturnPointer(b *testing.B) {
	b.ReportAllocs()

	t := 0
	for i := 0; i < b.N; i++ {
		v := newBigStructPtr()
		t += v.a[0]
	}
}

4. bigStructSize 10 测试

当bigStructSize设置为10,function-return-value的速度大约比function-return-pointer快两倍.

在使用指针的情况下,必须在堆上分配内存,这将花费大约25ns,然后设置数据(设置值在值返回和指针返回情况下应该花费大约相同的时间), 然后将指针写入堆栈以返回struct给调用者.

在值的情况下,没有堆内存分配,但必须将整个结构复制到堆栈以将其返回给调用者.

在此size的struct情况下,复制堆栈上的数据的开销小于分配内存的开销.

BenchmarkStructReturnValue-8  	100000000	15.4 ns/op	 0 B/op	0 allocs/op
BenchmarkStructReturnPointer-8	50000000	36.5 ns/op	80 B/op	1 allocs/op

4. bigStructSize 100 测试

当我们将bigStructSize变为100时,结构现在包含100个整数,ns/op绝对值的差距会增加,尽管指针情况的ns/op百分比增加更少.

BenchmarkStructReturnValue-8  	20000000	105 ns/op	  0 B/op	0 allocs/op
BenchmarkStructReturnPointer-8	10000000	185 ns/op	896 B/op	1 allocs/op

4. bigStructSize 1000 测试

如果我们在结构中尝试bigStructSize变为1000时,那么返回指针会更快吗?

BenchmarkStructReturnValue-8  	2000000	 830 ns/op	   0 B/op	0 allocs/op
BenchmarkStructReturnPointer-8	1000000	1401 ns/op	8192 B/op	1 allocs/op

4. bigStructSize 10000 测试

还是更糟糕.10,000又会是怎么样?

BenchmarkStructReturnValue-8  	100000	13332 ns/op	    0 B/op	0 allocs/op
BenchmarkStructReturnPointer-8	200000	11032 ns/op	81920 B/op	1 allocs/op

最后,在我们的struct中有10,000个int,返回指针的struct更快.经过一些进一步的调查,我的笔记本电脑上的平衡点似乎是2700.

5. Benchmark Profile

我很不清楚为什么1000整数的差异如此之大.让我们看一下benchmark profile!

5.1 Benchmark Profile 值返回

go test -bench BenchmarkStructReturnValue -run ^$ -cpuprofile cpu2.prof
go tool pprof  post.test cpu2.prof 
(pprof) top
Showing nodes accounting for 2.25s, 100% of 2.25s total
      flat  flat%   sum%        cum   cum%
     2.09s 92.89% 92.89%      2.23s 99.11%  github.com/philpearl/blog/content/post.newBigStruct
     0.14s  6.22% 99.11%      0.14s  6.22%  runtime.newstack
     0.02s  0.89%   100%      0.02s  0.89%  runtime.nanotime
         0     0%   100%      2.23s 99.11%  github.com/philpearl/blog/content/post.BenchmarkStructReturnValue
         0     0%   100%      0.02s  0.89%  runtime.mstart
         0     0%   100%      0.02s  0.89%  runtime.mstart1
         0     0%   100%      0.02s  0.89%  runtime.sysmon
         0     0%   100%      2.23s 99.11%  testing.(*B).launch
         0     0%   100%      2.23s 99.11%  testing.(*B).runN

在值返回的情况下,几乎所有工作都在newBigStruct中进行.这一切都非常直观.

5.1 Benchmark Profile 指针返回

如果我们分析指针测试会怎么样?

go test -bench BenchmarkStructReturnPointer -run ^$ -cpuprofile cpu.prof
go tool pprof post.test cpu.prof 
(pprof) top
Showing nodes accounting for 2690ms, 93.08% of 2890ms total
Dropped 28 nodes (cum <= 14.45ms)
Showing top 10 nodes out of 67
      flat  flat%   sum%        cum   cum%
    1110ms 38.41% 38.41%     1110ms 38.41%  runtime.pthread_cond_signal
     790ms 27.34% 65.74%      790ms 27.34%  runtime.pthread_cond_wait
     300ms 10.38% 76.12%      300ms 10.38%  runtime.usleep
     200ms  6.92% 83.04%      200ms  6.92%  runtime.pthread_cond_timedwait_relative_np
      80ms  2.77% 85.81%       80ms  2.77%  runtime.nanotime
      60ms  2.08% 87.89%      140ms  4.84%  runtime.sweepone
      50ms  1.73% 89.62%       50ms  1.73%  runtime.pthread_mutex_lock
      40ms  1.38% 91.00%      150ms  5.19%  github.com/philpearl/blog/content/post.newBigStructPtr
      30ms  1.04% 92.04%       40ms  1.38%  runtime.gcMarkDone
      30ms  1.04% 93.08%       40ms  1.38%  runtime.scanobject

在指针放回情况下,输出log要复杂得多,而且还有很多function使用了大量的CPU资源.只有约5%的时间花在newBigStructPtr上设置结构. 相反,Go运行时中有大量时间花费在处理线程和锁以及垃圾收集上.返回指针的底层函数很快,但分配指针所带来的包袱是一个巨大的开销.

6.结论:通常情况下使用value返回

现在这种情况非常简单.数据被创建然后立即被丢弃,因此垃圾收集器将面临巨大的负担. 如果返回数据的生命周期更长,则结果可能会非常不同.

  • 通常情况下我们最好还是return value
  • 生命时间短的struct return pointer是不推荐的
  • 大size的struct推荐使用pointer返回

相关文章什么时候使用指针Pointer